探索 MLOps 体系结构

作为数据科学家，你想要训练最佳机器学习模型。若要实现模型，需要将其部署到终结点，并将其与应用程序集成。

随着时间的推移，可能想要重新训练模型。例如，当你拥有更多的训练数据时，可以重新训练模型。

一般情况下，训练机器学习模型后，你会想要为企业级模型做好准备。若要准备模型并使其运作，需要：

设置开发和生产环境

在 MLOps 中（与 DevOps 情况类似），环境是指资源的集合。这些资源用于部署应用程序，或与机器学习项目一起用来部署模型。

注意

在本模块中，我们将引用环境的 DevOps 解释。请注意，Azure 机器学习还使用术语环境来描述运行脚本所需的 Python 包集合。这两个环境概念彼此独立。

你使用的环境数取决于你的组织。通常，至少有两个环境：开发和生产。此外，还可以在过渡或预生产环境之间添加环境。

典型的方法是：

实现 MLOps 并大规模使用机器学习模型时，最好在不同的阶段使用单独的环境。

假设你的团队使用开发、预生产和生产环境。并非你的所有团队成员都应获取对所有环境的访问权限。数据科学家只能在具有非生产数据的开发环境中工作，而机器学习工程师在具有生产数据的预生产和生产环境中部署模型。

使用单独的环境可以更轻松地控制对资源的访问。然后，每个环境都可以与单独的 Azure 机器学习工作区相关联。

Diagram of multiple Azure Machine Learning workspaces to have multiple environments.

在 Azure 中，你使用基于角色的访问控制 (RBAC) 为同事提供对他们需要处理的资源子集的适当访问权限级别。

或者，只能使用一个 Azure 机器学习工作区。使用一个工作区进行开发和生产时，Azure 占用空间更小，管理开销更少。但是，RBAC 同时应用于开发环境和专业环境，这可能意味着你为用户提供对资源的访问权限太少或太多。

提示

将模型投入到生产意味着你需要缩放解决方案并与其他团队合作。与其他数据科学家、数据工程师和基础结构团队一起，你可能决定使用以下方法：

因此，MLOps 体系结构包括以下部分：

Diagram of an architecture showcasing a typical MLOps project.

与大型团队合作时，不应以数据科学家的身份负责 MLOps 体系结构的所有部分。但是，若要为 MLOps 准备模型，应考虑如何针对监视和重新训练进行设计。