Azure Machine Learning リソースを特定する

完了

Azure Machine Learning のリソースとは、機械学習ワークフローを実行するために必要なインフラストラクチャのことです。 管理者のようなユーザーがリソースを作成して管理するのが理想的です。

Azure Machine Learning には次のようなリソースがあります。

  • ワークスペース
  • コンピューティング リソース
  • データストア

ワークスペースを作成して管理する

ワークスペースは、Azure Machine Learning の最上位のリソースです。 データ サイエンティストは、モデルをトレーニングして追跡するため、およびモデルをエンドポイントにデプロイするために、ワークスペースにアクセスする必要があります。

ただし、ワークスペースに "フル" アクセスできるユーザーには注意する必要があります。 コンピューティング リソースとデータストアへの参照の横には、ワークスペース内のコードのすべてのログ、メトリック、出力、モデル、スナップショットがあります。

コンピューティング リソースを作成して管理する

モデルをトレーニングまたはデプロイするときに必要になる最も重要なリソースの 1 つはコンピューティングです。 Azure Machine Learning ワークスペースには、次の 5 種類のコンピューティングがあります。

  • コンピューティング インスタンス: クラウド内の仮想マシンに似たもので、ワークスペースによって管理されます。 (Jupyter) ノートブックを実行するための開発環境として使用するのに最適です。
  • コンピューティング クラスター: クラウド内の CPU または GPU コンピューティング ノードのオンデマンド クラスターであり、ワークスペースによって管理されます。 ニーズに合わせて自動的にスケーリングするため、運用ワークロードに使用するのに最適です。
  • Kubernetes クラスター: Azure Kubernetes Service (AKS) クラスターを作成またはアタッチできます。 運用シナリオでトレーニング済みの機械学習モデルをデプロイするのに最適です。
  • アタッチされたコンピューティング: Azure Databricks や Synapse Spark プールなど、他の Azure コンピューティング リソースをワークスペースにアタッチできます。
  • サーバーレス コンピューティング: トレーニング ジョブに使用できるフル マネージドのオンデマンド コンピューティング。

Note

Azure Machine Learning は、"サーバーレス コンピューティング" を自動的に作成して管理するため、スタジオの [コンピューティング] ページには表示されません。 詳細については、モデルのトレーニングにサーバーレス コンピューティングを使用する方法に関するページを参照してください

コンピューティングは機械学習ワークロードを使うときに最も重要なリソースですが、最もコストのかかるリソースになる場合もあります。 そのため、管理者のみがコンピューティング リソースを作成および管理できるようにするのがベスト プラクティスです。 データ サイエンティストには、コンピューティングの編集を許可せず、利用できるコンピューティングを使ってワークロードを実行することだけを許可する必要があります。

データストアを作成して管理する

ワークスペースにはデータ自体は格納されません。 代わりに、すべてのデータはデータストアに格納されます。これは Azure データ サービスへの参照です。 データストアが表すデータ サービスへの接続情報は、Azure Key Vault に格納されます。

ワークスペースが作成されるときに、Azure ストレージ アカウントが作成されて、ワークスペースに自動的に接続されます。 その結果、ワークスペースには 4 つのデータストアが既に追加されています。

  • workspaceartifactstore: ワークスペースで作成される Azure Storage アカウントの azureml コンテナーに接続します。 ジョブの実行時に、コンピューティング ログと実験ログを格納するために使用されます。
  • workspaceworkingdirectory: スタジオの [ノートブック] セクションで使用されるワークスペースで作成される Azure Storage アカウントのファイル共有に接続します。 コンピューティング インスタンスからアクセスするファイルまたはフォルダーをアップロードするたびに、このファイル共有にアップロードされます。
  • workspaceblobstore: ワークスペースと共に作成される Azure ストレージ アカウントの Blob Storage に接続します。 具体的には、azureml-blobstore-... コンテナーです。 既定のデータストアとして設定します。つまり、データ資産を作成してデータをアップロードするたびに、データはこのコンテナーに格納されます。
  • workspacefilestore: ワークスペースと共に作成される Azure ストレージ アカウントのファイル共有に接続します。 具体的には、azureml-filestore-... ファイル共有です。

さらに、ユーザーはデータストアを作成して他の Azure データ サービスに接続することもできます。 データ サイエンス プロジェクトでは、Azure Storage アカウントまたは Azure Data Lake Storage (Gen2) が使用されることが多いため、データストアは通常、これらのデータ サービスに接続されます。