運用環境のモデルからのデータ収集

[アーティクル]
09/03/2024

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

この記事では、Azure Machine Learning オンラインエンドポイントにデプロイされたモデルからのデータ収集について説明します。

Azure Machine Learning データコレクターは、マネージドオンラインエンドポイントまたは Kubernetes オンラインエンドポイントにデプロイされたモデルからの入力データと出力データのリアルタイムログを提供します。 Azure Machine Learning は、ログに記録された推論データを Azure BLOB ストレージに格納します。このデータは、モデルの監視、デバッグ、または監査にシームレスに使用できるため、デプロイされたモデルのパフォーマンスを監視できます。

データコレクターには次の機能があります。

中央の場所への推論データのログ記録 (Azure Blob Storage)
マネージドオンラインエンドポイントと Kubernetes オンラインエンドポイントのサポート
デプロイレベルで定義し、その構成に最大限の変更を加えることが可能
ペイロードとカスタムログの両方のサポート

ログモード

データコレクターには、"ペイロードログ" と "カスタムログ" という 2 つのログモードが用意されています。ペイロードログを使用すると、デプロイされたモデルから HTTP 要求と応答のペイロードデータを収集できます。 Azure Machine Learning では、カスタムログを使用して、スコアリングスクリプトから pandas DataFrames を直接ログ記録するための Python SDK が提供されます。カスタムログ Python SDK を使用すると、データ変換 (または前処理) の前、中、後のデータに加え、モデルの入力データと出力データをログに記録できます。

データコレクターの構成

データコレクターはデプロイレベルで構成でき、構成はデプロイ時に指定されます。収集されたデータを受信する Azure Blob Storage の宛先を構成できます。収集するデータのサンプリングレート (0 – 100%) も構成できます。

制限事項

データコレクターには次の制限事項があります。

データコレクターは、オンライン (またはリアルタイム) の Azure Machine Learning エンドポイント (マネージドまたは Kubernetes) のログ記録のみをサポートします。
データコレクター Python SDK では、pandas DataFrames を使用した表形式データのログ記録のみがサポートされています。

次の方法で共有

運用環境のモデルからのデータ収集

ログモード

データコレクターの構成

制限事項

フィードバック

その他のリソース

次の方法で共有

運用環境のモデルからのデータ収集

ログ モード

データ コレクターの構成

制限事項

関連するコンテンツ

フィードバック

その他のリソース

ログモード

データコレクターの構成