リファレンス: Embeddings | Azure AI Studio

重要

この記事で "(プレビュー)" と付記されている項目は、現在、パブリック プレビュー段階です。 このプレビューはサービス レベル アグリーメントなしで提供されており、運用環境ではお勧めしません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

入力テキストを表す埋め込みベクトルを作成します。

POST /embeddings?api-version=2024-04-01-preview

URI パラメーター

名前 / 必須 タイプ 説明
api-version クエリ string "YYYY-MM-DD" または "YYYY-MM-DD-preview" 形式の API のバージョン。

要求ヘッダー

名前 Required タイプ 説明
extra-parameters string ペイロードに追加のパラメーターが指定されている場合の API の動作。 pass-through を使用すると、この API は、基になるモデルにパラメーターを渡すことができます。 この値は、基になるモデルがサポートできるとわかっているパラメーターを渡す場合に使用します。 ignore を使用すると、この API は、サポートされていないパラメーターを削除します。 この値は、異なるモデル間で同じペイロードを使用する必要があり、モデルでサポートされていない場合にエラーになる可能性がある追加のパラメーターの 1 つを使用する場合に使用します。 error を使用すると、この API はペイロード内の追加のパラメーターを拒否します。 この API で指定されたパラメーターのみを指定できます。それ以外の場合は 400 エラーが返されます。
azureml-model-deployment string 要求のルーティング先のデプロイの名前。 複数のデプロイをサポートするエンドポイントでサポートされます。

要求本文

名前 Required タイプ 説明
モデル string モデル名。 エンドポイントが 1 つのモデルのみを処理する場合、このパラメーターは無視されます。
input True string[] 埋め込むテキストを入力します。トークンの文字列または配列としてエンコードされます。 1 回の要求で複数の入力を埋め込むには、文字列の配列またはトークン配列の配列を渡します。
dimensions integer 結果として出力される埋め込みに必要なディメンションの数。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
encoding_format EmbeddingEncodingFormat 埋め込みを返す形式。 base64、float、int8、uint8、binary、または ubinary のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
input_type EmbeddingInputType 入力の "種類"。 textquery、または document のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。

応答

名前 種類 説明
200 OK CreateEmbeddingResponse [OK]
401 権限がありません UnauthorizedError アクセス トークンが見つからないか無効です

ヘッダー

x-ms-error-code: string
404 見つかりません NotFoundError モダリティがモデルによってサポートされていません。 モデルのドキュメントを確認して、どのルートが利用可能であるかを確認します。

ヘッダー

x-ms-error-code: string
422 処理できなかったエンティティ UnprocessableContentError 要求に処理できないコンテンツが含まれています

ヘッダー

x-ms-error-code: string
429 要求が多すぎます TooManyRequestsError 割り当てられたレート制限に達したため、要求のペースを調整する必要があります。

ヘッダー

x-ms-error-code: string
その他の状態コード ContentFilterError Bad request

ヘッダー

x-ms-error-code: string

セキュリティ

承認

Bearer: prefix が付いたトークン (例: Bearer abcde12345)

種類: apiKey 入力: ヘッダー

AADToken

Azure Active Directory OAuth2 認証

種類: oauth2 フロー: アプリケーション トークン URL: https://login.microsoftonline.com/common/oauth2/v2.0/token

入力テキストを表す埋め込みベクトルを作成します

サンプル要求

POST /embeddings?api-version=2024-04-01-preview

{
  "input": [
    "This is a very good text"
  ],
  "input_type": "text",
  "encoding_format": "float",
  "dimensions": 1024
}

サンプル応答

状態コード:200

{
  "data": [
    {
      "index": 0,
      "object": "embedding",
      "embedding": [
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0,
        0
      ]
    }
  ],
  "object": "list",
  "model": "BERT",
  "usage": {
    "prompt_tokens": 15,
    "total_tokens": 15
  }
}

定義

名前 説明
ContentFilterError プロンプトが構成どおりにコンテンツ フィルターをトリガーすると、API 呼び出しは失敗します。 プロンプトを変更して、もう一度やり直してください。
CreateEmbeddingRequest 埋め込み作成の要求。
CreateEmbeddingResponse 埋め込み要求からの応答。
詳細 エラーの詳細。
埋め込み 生成された埋め込みオブジェクトを表します。
EmbeddingEncodingFormat 埋め込みを返す形式。 base64、float、int8、uint8、binary、または ubinary のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
EmbeddingInputType 入力の "種類"。 textquery、または document のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
EmbeddingObject オブジェクトの種類。これは常に "embedding" です。
ListObject オブジェクトの種類。常に "list" です。
NotFoundError デプロイされたモデルに対してルートが無効です。
TooManyRequestsError 割り当てられたレート制限に達したため、要求のペースを調整する必要があります。
UnauthorizedError 認証が見つからないか、無効です。
UnprocessableContentError 要求に処理できないコンテンツが含まれています。 指定されたペイロードがこの仕様に従って有効な場合、エラーが返されます。 ただし、ペイロードに示されている命令の一部は、基になるモデルではサポートされていません。 details セクションは、問題のあるパラメーターを理解するために使用します。
使用方法 要求の使用状況に関する情報。

ContentFilterError

プロンプトが構成どおりにコンテンツ フィルターをトリガーすると、API 呼び出しは失敗します。 プロンプトを変更して、もう一度やり直してください。

名前 種類 説明
code string エラー コード。
エラー string エラーの説明。
message string エラー メッセージ。
param string コンテンツ フィルターをトリガーしたパラメーター。
status integer HTTP 状態コード。

CreateEmbeddingRequest

埋め込み作成の要求。

名前 Required タイプ 説明
input True string[] 埋め込むテキストを入力します。トークンの文字列または配列としてエンコードされます。 1 回の要求で複数の入力を埋め込むには、文字列の配列またはトークン配列の配列を渡します。
dimensions integer 結果として出力される埋め込みに必要なディメンションの数。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
encoding_format EmbeddingEncodingFormat 埋め込みを返す形式。 base64、float、int8、uint8、binary、または ubinary のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。
input_type EmbeddingInputType 入力の "種類"。 textquery、または document のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。

CreateEmbeddingResponse

埋め込み要求からの応答。

名前 種類 説明
data Embedding[] モデルによって生成された埋め込みの一覧。
モデル string 埋め込みを生成するために使われるモデルの名前。
オブジェクト ListObject オブジェクトの種類。常に "list" です。
使用量 使用方法 要求の使用状況に関する情報。

詳細

UnprocessableContentError エラーの詳細。

名前 種類 説明
loc string[] 問題の原因となっているパラメーター
string 問題の原因となっているパラメーターに渡される値。

埋め込み

生成された埋め込みを表します。

名前 種類 説明
埋め込み [] 埋め込みベクトル。 ベクターの長さは使用されるモデルによって異なり、型は使用される encoding_format によって異なります。
インデックス integer 埋め込みリスト内の埋め込みのインデックス。
オブジェクト EmbeddingObject オブジェクトの種類。これは常に "embedding" です。

EmbeddingEncodingFormat

埋め込みを返す形式。 base64、float、int8、uint8、binary、または ubinary のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。

名前 種類 説明
base64 string
binary string
float string
int8 string
ubinary string
uint8 string

EmbeddingInputType

入力の "種類"。 textquery、または document のいずれか。 モデルが値またはパラメーターをサポートしていない場合は、422 エラーを返します。

名前 種類 説明
ドキュメント string ベクター データベースに格納されているドキュメントを入力が表していることを示します。
クエリ string ベクター データベース内の最も関連性の高いドキュメントを検索するための検索クエリを入力が表していることを示します。
text string 入力が一般的なテキスト入力であることを示します。

EmbeddingObject

名前 種類 説明
埋め込み string

ListObject

オブジェクトの種類。常に "list" です。

名前 種類 説明設定
list string

NotFoundError

名前 種類 説明
エラー string エラーの説明。
message string エラー メッセージ。
status integer HTTP 状態コード。

TooManyRequestsError

名前 種類 説明
エラー string エラーの説明。
message string エラー メッセージ。
status integer HTTP 状態コード。

UnauthorizedError

名前 種類 説明
エラー string エラーの説明。
message string エラー メッセージ。
status integer HTTP 状態コード。

UnprocessableContentError

要求に処理できないコンテンツが含まれています。 指定されたペイロードがこの仕様に従って有効な場合、エラーが返されます。 ただし、ペイロードに示されている命令の一部は、基になるモデルではサポートされていません。 details セクションは、問題のあるパラメーターを理解するために使用します。

名前 種類 説明
code string エラー コード。
詳細 詳細
エラー string エラーの説明。
message string エラー メッセージ。
status integer HTTP 状態コード。

使用方法

要求の使用状況に関する情報。

名前 種類 説明
prompt_tokens integer プロンプトで使用されるトークンの数。
total_tokens integer 要求によって使用されるトークンの合計数。