ビジネス上の問題を把握する
あなたは Proseware に勤務しています。医療の向上を目指す設立したばかりのスタートアップ企業です。 あなたはデータ サイエンス チームと連携し、最近、糖尿病分類モデルの運用化に関する作業を完了しました。 つまり、ノートブックをスクリプトに変換し、Azure Machine Learning のジョブとして実行できるようにしました。
Proseware のビジネスと技術の関係者にエンドツーエンド ソリューションをプレゼンテーションした際に、モデル作成の観点と消費の観点の両方から、このモデルの使用をスケーリングする方法についていくつかの質問が出ました。
医療分野の多くのモデルは患者の医療データを使って病気を予測します。 以前のプロジェクトから、多くの場合、このようなモデルは、モデルをトレーニングする母集団の地理的な位置に大きく左右されることがわかっています。 このモデルをスケーラブルにするには、異なるデータ セグメントに基づいて、異なるバージョンのモデルを自動的にトレーニングできるようにする必要があります。
ミーティングでは、機械学習運用 (MLOps) 戦略を実装し、データ サイエンス チームが医師の Web アプリ用に開発した分類モデルなどのモデルを迅速に作成、更新、デプロイできるようにすることをビジネスと技術の関係者が決定しました。
Proseware では、コードのバージョン管理に GitHub を使っているので、MLOps 戦略の自動化コンポーネントとして GitHub Actions を使うことを決定しました。
自動化プロセスを実装する最初の手順は、Azure Machine Learning ジョブを使って糖尿病分類モデルをトレーニングする GitHub Action を開発することです。
Azure Machine Learning コンピューティングを使ってモデルのトレーニングをトリガーする GitHub Action を作成するには、次のことを行います。
- Azure CLI を使ってサービス プリンシパルを作成します。
- サービス プリンシパルの資格情報を GitHub のシークレットとして格納します。
- Azure Machine Learning コンピューティングを使ってモデルをトレーニングする GitHub Action を作成します。