Azure AI Search エンリッチメントパイプラインの AML スキル

[アーティクル]
09/01/2024

重要

Azure AI Studio モデルカタログへのインデクサー接続のサポートは、使用条件の下でパブリックプレビュー段階にあります。プレビュー REST API では、このスキルがサポートされています。

AML スキルを使用すると、カスタム Azure Machine Learning (AML) モデルを使用して AI エンリッチメントを拡張できます。 AML モデルがトレーニングされてデプロイされると、AML スキルによって AI エンリッチメントに統合されます。

他の組み込みスキルと同様に、AML スキルには入力と出力があります。入力は、デプロイされた AML オンラインエンドポイントに JSON オブジェクトとして送信され、成功状態コードとともに JSON ペイロードを応答として出力します。データは、モデルがデプロイされている geo で処理されます。応答には、AML スキルによって指定された出力が含まれることが想定されます。その他の応答はエラーと見なされ、エンリッチメントは実行されません。

AML スキルは、2024-07-01 安定した API バージョンまたは Azure AI Studio のモデルカタログへの接続用の 2024-05-01-preview API バージョンを使用して呼び出すことができます。

2024-05-01-preview REST API と Azure portal (2024-05-01-preview も対象) から、Azure AI Search では、Azure AI Studio のモデルカタログへのクエリ時間接続用の Azure AI Studio モデルカタログベクターライザーが導入されました。そのベクタライザーをクエリに使用する場合、AML スキルは、Azure AI Studio モデルカタログ内のモデルを使用して埋め込みを生成するためのインデックス作成に対応するスキルです。

インデックス作成中、 AML スキルはモデルカタログに接続して、インデックスのベクトルを生成できます。クエリ時に、クエリはベクター化を使用して同じモデルに接続し、ベクタークエリのテキスト文字列をベクター化できます。このワークフローでは、インデックス作成とクエリの両方に同じ埋め込みモデルを使用できるように、 AML スキルとモデルカタログベクターライザーを一緒に使用する必要があります。このワークフローの詳細については、「 Azure AI Studio のモデルを使用して統合ベクター化を実装する方法を参照してください。

Note

インデクサーは、AML オンラインエンドポイントから特定の標準 HTTP 状態コードが返された場合には、再試行を 2 回行います。これらの HTTP 状態コードは次のとおりです。

503 Service Unavailable
429 Too Many Requests

前提条件

AML ワークスペース
このワークスペースでのオンラインエンドポイント (リアルタイム)。

@odata.type

Microsoft.Skills.Custom.AmlSkill

スキルのパラメーター

パラメーターの大文字と小文字は区別されます。どのパラメーターを使用するかは、AML オンラインエンドポイントが必要とする認証 (存在する場合) によって異なります

パラメーター名	説明
`uri`	(キー認証の場合に必要) JSON ペイロードが送信される AML オンラインエンドポイントのスコアリング URI。 https URI スキームのみが許可されます。
`key`	(キー認証の場合に必要) AML オンラインエンドポイントのキー。
`resourceId`	(トークン認証の場合に必要)。 AML オンラインエンドポイントの Azure Resource Manager リソース ID。 subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/onlineendpoints/{endpoint_name} という形式にする必要があります。
`region`	(トークン認証の場合は省略可能)。 AML オンラインエンドポイントがデプロイされるリージョン。
`timeout`	(省略可能) 指定した場合は、API 呼び出しを行う http クライアントのタイムアウト値を示します。 XSD "dayTimeDuration" 値 (ISO 8601 期間値の制限されたサブセット) として書式設定する必要があります。たとえば、60 秒の場合は `PT60S` とします。設定しなかった場合は、既定値の 30 秒が選択されます。タイムアウトは、最大で 230 秒、最小で 1 秒に設定できます。
`degreeOfParallelism`	(省略可能) 指定した場合は、指定したエンドポイントに対してインデクサーが並列で行う呼び出しの数を示します。要求負荷が高すぎてエンドポイントが失敗する場合は、この値を減らすことができます。エンドポイントで詳細な要求を受け入れることができ、インデクサーのパフォーマンスを向上させる必要がある場合は、この値を増やすことができます。設定しない場合は、既定値の 5 が使用されます。 degreeOfParallelism には、最大値として 10、最小値として 1 を設定できます。

使用するスキルパラメーター

必要な AML スキルパラメーターは、AML オンラインエンドポイントが使用する認証 (存在する場合) に応じて異なります。 AML オンラインエンドポイントでは、次の 2 つの認証オプションが提供されます。

キーベースの認証。 AML スキルからのスコアリング要求を認証するために、静的なキーが提供されます。
- uri および key パラメーターを使用します。
トークンベースの認証。 AML オンラインエンドポイントは、トークンベースの認証を使用してデプロイされます。 Azure AI Search Serviceのマネージド ID を有効にする必要があります。その後、AML スキルは、サービスのマネージド ID を使用して、静的キーを必要とせず、AML オンラインエンドポイントに対して認証します。 ID は、所有者または共同作成者ロールに割り当てられる必要があります。
- resourceId パラメーターを使用します。
- 検索サービスが AML ワークスペースとは異なるリージョンにある場合は、 リージョン パラメータを使用して、AML オンラインエンドポイントがデプロイされたリージョンを設定します

スキルの入力

このスキルの "定義済みの" 入力はありません。このスキルの実行時に既に利用可能な 1 つ以上のフィールドを入力として選択できます。そのため、AML オンラインエンドポイントに送信される JSON ペイロードには、さまざまなフィールドが存在することになります。

スキルの出力

このスキルの "定義済みの" 出力はありません。 AML オンラインエンドポイントが返す応答に応じて出力フィールドを追加し、JSON 応答からそれらを選択できるようにしてください。

定義例

  {
    "@odata.type": "#Microsoft.Skills.Custom.AmlSkill",
    "description": "A sample model that detects the language of sentence",
    "uri": "https://contoso.count-things.com/score",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "detected_language_code"
      }
    ]
  }

入力の JSON 構造体のサンプル

この JSON 構造体は、AML オンラインエンドポイントに送信されるペイロードを表します。構造体の最上位レベルのフィールドは、スキル定義の inputs セクションで指定された "names" に対応します。これらのフィールドの値は、それらのフィールドの source からの値になります (これは、ドキュメント内のフィールドからの値になる可能性もありますし、他のスキルからの値になる可能性もあります)

{
  "text": "Este es un contrato en Inglés"
}

出力の JSON 構造体のサンプル

出力は、AML オンラインエンドポイントから返された応答に対応します。 AML オンラインエンドポイントは、JSON ペイロードのみを返す必要があります (Content-Type 応答ヘッダーを確認することで検証されます)。また、フィールドが output 内の "names" に一致するエンリッチメントで、値がエンリッチメントと見なされるオブジェクトである必要もあります。

{
    "detected_language_code": "es"
}

インライン整形のサンプルの定義

  {
    "@odata.type": "#Microsoft.Skills.Custom.AmlSkill",
    "description": "A sample model that detects the language of sentence",
    "uri": "https://contoso.count-things.com/score",
    "context": "/document",
    "inputs": [
      {
        "name": "shapedText",
        "sourceContext": "/document",
        "inputs": [
            {
              "name": "content",
              "source": "/document/content"
            }
        ]
      }
    ],
    "outputs": [
      {
        "name": "detected_language_code"
      }
    ]
  }

インライン整形の入力 JSON 構造体

{
  "shapedText": { "content": "Este es un contrato en Inglés" }
}

インライン整形のサンプル出力 JSON 構造体

{
    "detected_language_code": "es"
}

エラーになる場合

AML が利用できない場合や、成功以外の状態コードが送信された場合に加え、次の場合もエラーと見なされます。

AML オンラインエンドポイントからは成功の状態コードが返されたものの、応答ではそれが application/json でないと示されている場合、その応答は無効と見なされ、エンリッチメントは実行されません。
AML オンラインエンドポイントが有効な JSON を返す場合

AML オンラインエンドポイントが利用できないか、HTTP エラーが返された場合は、HTTP エラーに関する入手可能な詳細情報が含まれるわかりやすいエラーが、インデクサーの実行履歴に追加されます。

次の方法で共有

Azure AI Search エンリッチメントパイプラインの AML スキル

前提条件

@odata.type

スキルのパラメーター

使用するスキルパラメーター

スキルの入力

スキルの出力

定義例

入力の JSON 構造体のサンプル

出力の JSON 構造体のサンプル

インライン整形のサンプルの定義

インライン整形の入力 JSON 構造体

インライン整形のサンプル出力 JSON 構造体

エラーになる場合

関連項目

フィードバック

その他のリソース

次の方法で共有

Azure AI Search エンリッチメント パイプラインの AML スキル

前提条件

@odata.type

スキルのパラメーター

使用するスキル パラメーター

スキルの入力

スキルの出力

定義例

入力の JSON 構造体のサンプル

出力の JSON 構造体のサンプル

インライン整形のサンプルの定義

インライン整形の入力 JSON 構造体

インライン整形のサンプル出力 JSON 構造体

エラーになる場合

関連項目

フィードバック

その他のリソース

Azure AI Search エンリッチメントパイプラインの AML スキル

使用するスキルパラメーター