Machine Learning service のワークスペース データをエクスポートまたは削除する

Azure Machine Learning では、ポータルのグラフィカル インターフェイスまたは Python SDK を使用して、ワークスペース データをエクスポートまたは削除できます。 この記事では、両方のオプションについて説明します。

注意

個人データの表示または削除については、「GDPR のための Azure データ サブジェクト要求」を参照してください。 GDPR の詳細については、Microsoft Trust Center の GDPR に関するセクションおよび Service Trust Portal の GDPR に関するセクションをご覧ください。

Note

この記事は、デバイスまたはサービスから個人データを削除する手順について説明しており、GDPR の下で義務を果たすために使用できます。 GDPR に関する一般情報については、Microsoft Trust Center の GDPR に関するセクションおよび Service Trust Portal の GDPR に関するセクションをご覧ください。

ワークスペース データを制御する

Azure Machine Learning は、エクスポートおよび削除が可能な製品内データを保存します。 Azure Machine Learning スタジオ、CLI、または SDK を使用してデータのエクスポートと削除を行うことができます。 さらに、Azure プライバシー ポータルからテレメトリ データにアクセスできます。

Azure Machine Learning では、個人データはジョブ履歴ドキュメント内のユーザー情報で構成されます。

Azure ワークスペースは、リソース グループに依存して、Azure ソリューションの関連リソースを保持します。 ワークスペースを作成するときは、既存のリソース グループを使用することも、新しいリソース グループを作成することもできます。 Azure リソース グループの詳細については、こちらのリソースを参照してください。

ポータルを使用して高レベル リソースを削除する

ワークスペースを作成すると、Azure によってリソース グループ内にいくつかのリソースが作成されます。

  • ワークスペース自体
  • ストレージ アカウント
  • コンテナー レジストリ
  • Application Insights インスタンス
  • キー コンテナー

これらのリソースを削除するには、以下の一覧からリソースを選択し、[削除] を選択します。

重要

リソースが論理的な削除用に構成されている場合、必要に応じてリソースを完全に削除することを選択しない限り、データは実際に削除されません。 詳細については、以下のリソースを参照してください。

削除アイコンが強調表示されているポータルのスクリーンショット。

確認ダイアログ ボックスが開き、選択内容を確認できます。

ジョブ履歴ドキュメントには、個人のユーザー情報が含まれている場合があります。 これらのドキュメントが、/azureml サブフォルダーの BLOB ストレージのストレージ アカウントに保存されます。 データは、ポータルからダウンロードおよび削除することができます。 まず、次のスクリーンショットに示すように、Azure portal で [ストレージ アカウント] Azure サービスを選択します。

Azure portal でのストレージ アカウントの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、[ストレージ アカウント] ページで、関連するストレージ アカウントを選択します。

特定のストレージ アカウントの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、[コンテナー] を選択します。

[ストレージ アカウント] ページでの [コンテナー] の選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、特定のコンテナーを選択します。

特定のコンテナーの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、そのコンテナー内で削除したいリソースを選択して削除します。

特定のリソースの削除の様子を示すスクリーンショット。

Azure Machine Learning Studio を使用して機械学習リソースをエクスポートおよび削除する

Azure Machine Learning スタジオは、機械学習リソース (たとえば、データ資産、モデル、ノートブック、ジョブなど) の統合ビューを提供します。 Azure Machine Learning Studio では、データと実験の記録を保持することに注力しています。 ブラウザーの右側にあるパイプラインやコンピューティング リソースなどの計算リソースを削除できます。 これらのリソースについては、問題のリソースに移動し、[削除] を選択します。

データ資産とアーカイブ ジョブの登録を解除することはできますが、これらの操作ではデータは削除されません。 データを完全に削除するには、データ資産とジョブ データにはストレージ レベルでの削除が必要になります。 ストレージ レベルでの削除は、前に説明したようにポータルで行います。 Azure Machine Learning スタジオでは、個々の削除を処理できます。 ジョブを削除すると、そのジョブのデータが削除されます。

ジョブの成果物とログのダウンロード

Azure Machine Learning スタジオは、試験的なジョブからのトレーニング成果物とログのダウンロードを処理できます。 Azure Machine Learning スタジオのメイン ページで、次のスクリーンショットに示すように、[ジョブ] を選択します。

Azure Machine Learning スタジオでの [ジョブ] の選択の様子を示すスクリーンショット。

利用可能なジョブを表示するには、次のスクリーンショットに示すように、[すべてのジョブ] タブを選択します。

[すべてのジョブ] タブの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、特定のジョブを選択します。

特定のジョブの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、[すべてをダウンロード] を選択します。

ジョブ ダウンロード プロセスを開始する方法を示すスクリーンショット。

登録済みモデルをダウンロードする

登録済みモデルをダウンロードするには、次のスクリーンショットに示すように、Azure Machine Learning スタジオで [モデル] を選択して [モデル リスト] を開いた後、特定のモデルを選択します。

特定のモデルの選択の様子を示すスクリーンショット。

次のスクリーンショットに示すように、[すべてをダウンロード] を選択して、モデル ダウンロード プロセスを開始します。

モデル ダウンロード プロセスを開始する方法を示すスクリーンショット。

Python SDK を使用してリソースをエクスポートおよび削除する

以下を使用して、特定のジョブの出力をダウンロードできます。

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

以下のように Python SDK を使用することで、これらの機械学習リソースを削除できます。

Type 関数呼び出し Notes
Workspace delete delete-dependent-resources を使用して削除を連鎖させる
Model delete
ComputeTarget delete
WebService delete

次のステップ

ワークスペースの管理の詳細を確認する