Azure AI Studio で Cohere Embed V3 モデルを使用する方法

Cohere 埋め込みモデル

埋め込み用の Cohere ファミリのモデルには、次のモデルが含まれています。

Cohere Embed v3 - English
Cohere Embed v3 - Multilingual

Cohere Embed English は、セマンティック検索、検索拡張生成 (RAG)、分類、クラスタリングに使用される、テキスト表現モデルです。 Embed English は、HuggingFace (大規模なテキスト埋め込み) MTEB ベンチマークと、財務、法務、汎用コーパスなど、さまざまな業界のユースケースで優れたパフォーマンスを発揮します。 Embed English には次の属性もあります。

Embed English には 1,024 個のディメンションがあります。
モデルのコンテキストウィンドウは 512 トークンです

前提条件

Azure AI Studio で Cohere Embed V3 チャットモデルを使用するには、次の前提条件を満たす必要があります。

モデルデプロイ

サーバーレス API へのデプロイ

Cohere Embed V3 チャットモデルは、従量課金制でサーバーレス API エンドポイントにデプロイできます。この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。

サーバーレス API エンドポイントへのデプロイでは、サブスクリプションからのクォータは必要ありません。モデルがまだデプロイされていない場合は、Azure AI Studio、Azure Machine Learning SDK for Python、Azure CLI、または ARM テンプレートを使用して、モデルをサーバーレス API としてデプロイします。

サーバーレス API エンドポイントにモデルをデプロイする

インストールされている推論パッケージ

Python で azure-ai-inference パッケージを使用して、このモデルから予測を実行できます。このパッケージをインストールするには、次の前提条件を満たす必要があります。

Python 3.8 以降 (PIP を含む) がインストールされている
エンドポイント URL。クライアントライブラリを構築するには、エンドポイント URL を渡す必要があります。エンドポイント URL の形式は https://your-host-name.your-azure-region.inference.ai.azure.com です。ここで、your-host-name は一意のモデルデプロイホスト名、your-azure-region はモデルがデプロイされている Azure リージョン (eastus2 など) です。
モデルデプロイと認証の設定に応じて、サービスに対する認証キーまたは Microsoft Entra ID 認証情報が必要です。キーは 32 文字の文字列です。

これらの前提条件が満たされたら、次のコマンドを使用して Azure AI 推論パッケージをインストールします。

pip install azure-ai-inference

Azure AI 推論パッケージとリファレンスに関する詳細をご覧ください。

ヒント

さらに、Cohere は、モデルの特定の機能で使用するためにカスタマイズされた API の使用をサポートしています。モデルプロバイダー固有の API を使用するには、Cohere のドキュメントを参照してください。

埋め込みの操作

このセクションでは、埋め込みモデルと共に Azure AI モデル推論 API を使用します。

モデルを実行するクライアントを作成する

まず、モデルを実行するクライアントを作成します。次のコードでは、環境変数に格納されているエンドポイント URL とキーを使用しています。

import os
from azure.ai.inference import EmbeddingsClient
from azure.core.credentials import AzureKeyCredential

model = EmbeddingsClient(
    endpoint=os.environ["AZURE_INFERENCE_ENDPOINT"],
    credential=AzureKeyCredential(os.environ["AZURE_INFERENCE_CREDENTIAL"]),
)

モデルの機能を取得する

/info ルートは、エンドポイントにデプロイされたモデルに関する情報を返します。次のメソッドを呼び出してモデルの情報を返します。

model_info = model.get_model_info()

応答は次のとおりです。

print("Model name:", model_info.model_name)
print("Model type:", model_info.model_type)
print("Model provider name:", model_info.model_provider)

Model name: Cohere-embed-v3-english
Model type": embeddings
Model provider name": Cohere

埋め込みを作成する

モデルの出力を表示する埋め込み要求を作成します。

response = model.embed(
    input=["The ultimate answer to the question of life"],
)

ヒント

Cohere Embed V3 モデルのコンテキストウィンドウは 512 です。埋め込みを作成するときに、この制限を超えないようにしてください。

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

import numpy as np

for embed in response.data:
    print("Embeding of size:", np.asarray(embed.embedding).shape)

print("Model:", response.model)
print("Usage:", response.usage)

埋め込みを入力バッチで計算すると便利です。パラメーター inputs は、各文字列は異なる入力の、文字列のリストにすることができます。さらに、応答は埋め込みの一覧であり、各埋め込みは同じ位置の入力に対応します。

response = model.embed(
    input=[
        "The ultimate answer to the question of life", 
        "The largest planet in our solar system is Jupiter",
    ],
)

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

import numpy as np

for embed in response.data:
    print("Embeding of size:", np.asarray(embed.embedding).shape)

print("Model:", response.model)
print("Usage:", response.usage)

ヒント

Cohere Embed V3 モデルでは、一度に 1,024 個のバッチを使用できます。バッチを作成するときは、この制限を超えないようにしてください。

さまざまな種類の埋め込みを作成する

Cohere Embed V3 モデルでは、予定している使用方法に応じて、同じ入力に対して複数の埋め込みを生成できます。この機能を使用すると、RAG パターンのより正確な埋め込みを取得できます。

次の例は、ベクターデータベースに保存されるドキュメントの埋め込みを作成するために使用される埋め込みを作成する方法を示しています。

from azure.ai.inference.models import EmbeddingInputType

response = model.embed(
    input=["The answer to the ultimate question of life, the universe, and everything is 42"],
    input_type=EmbeddingInputType.DOCUMENT,
)

クエリでこのようなドキュメントを取得する場合は、次のコードスニペットを使用してクエリの埋め込みを作成し、検索パフォーマンスを最大化できます。

from azure.ai.inference.models import EmbeddingInputType

response = model.embed(
    input=["What's the ultimate meaning of life?"],
    input_type=EmbeddingInputType.QUERY,
)

Cohere Embed V3 モデルは、そのユースケースに基づいて埋め込みを最適化できます。

Cohere 埋め込みモデル

埋め込み用の Cohere ファミリのモデルには、次のモデルが含まれています。

Cohere Embed v3 - English
Cohere Embed v3 - Multilingual

Cohere Embed English は、セマンティック検索、検索拡張生成 (RAG)、分類、クラスタリングに使用される、テキスト表現モデルです。 Embed English は、HuggingFace (大規模なテキスト埋め込み) MTEB ベンチマークと、財務、法務、汎用コーパスなど、さまざまな業界のユースケースで優れたパフォーマンスを発揮します。 Embed English には次の属性もあります。

Embed English には 1,024 個のディメンションがあります。
モデルのコンテキストウィンドウは 512 トークンです

前提条件

Azure AI Studio で Cohere Embed V3 チャットモデルを使用するには、次の前提条件を満たす必要があります。

モデルデプロイ

サーバーレス API へのデプロイ

Cohere Embed V3 チャットモデルは、従量課金制でサーバーレス API エンドポイントにデプロイできます。この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。

サーバーレス API エンドポイントへのデプロイでは、サブスクリプションからのクォータは必要ありません。モデルがまだデプロイされていない場合は、Azure AI Studio、Azure Machine Learning SDK for Python、Azure CLI、または ARM テンプレートを使用して、モデルをサーバーレス API としてデプロイします。

サーバーレス API エンドポイントにモデルをデプロイする

インストールされている推論パッケージ

npm から @azure-rest/ai-inference パッケージを使用して、このモデルから予測を実行できます。このパッケージをインストールするには、次の前提条件を満たす必要があります。

Node.js の LTS バージョン (npm を含む)
エンドポイント URL。クライアントライブラリを構築するには、エンドポイント URL を渡す必要があります。エンドポイント URL の形式は https://your-host-name.your-azure-region.inference.ai.azure.com です。ここで、your-host-name は一意のモデルデプロイホスト名、your-azure-region はモデルがデプロイされている Azure リージョン (eastus2 など) です。
モデルデプロイと認証の設定に応じて、サービスに対する認証キーまたは Microsoft Entra ID 認証情報が必要です。キーは 32 文字の文字列です。

これらの前提条件が満たされたら、次のコマンドを使用して JavaScript 用 Azure 推論ライブラリパッケージをインストールします。

npm install @azure-rest/ai-inference

ヒント

さらに、Cohere は、モデルの特定の機能で使用するためにカスタマイズされた API の使用をサポートしています。モデルプロバイダー固有の API を使用するには、Cohere のドキュメントを参照してください。

埋め込みの操作

このセクションでは、埋め込みモデルと共に Azure AI モデル推論 API を使用します。

モデルを実行するクライアントを作成する

まず、モデルを実行するクライアントを作成します。次のコードでは、環境変数に格納されているエンドポイント URL とキーを使用しています。

import ModelClient from "@azure-rest/ai-inference";
import { isUnexpected } from "@azure-rest/ai-inference";
import { AzureKeyCredential } from "@azure/core-auth";

const client = new ModelClient(
    process.env.AZURE_INFERENCE_ENDPOINT, 
    new AzureKeyCredential(process.env.AZURE_INFERENCE_CREDENTIAL)
);

モデルの機能を取得する

/info ルートは、エンドポイントにデプロイされたモデルに関する情報を返します。次のメソッドを呼び出してモデルの情報を返します。

await client.path("/info").get()

応答は次のとおりです。

console.log("Model name: ", model_info.body.model_name);
console.log("Model type: ", model_info.body.model_type);
console.log("Model provider name: ", model_info.body.model_provider_name);

Model name: Cohere-embed-v3-english
Model type": embeddings
Model provider name": Cohere

埋め込みを作成する

モデルの出力を表示する埋め込み要求を作成します。

var response = await client.path("/embeddings").post({
    body: {
        input: ["The ultimate answer to the question of life"],
    }
});

ヒント

Cohere Embed V3 モデルのコンテキストウィンドウは 512 です。埋め込みを作成するときに、この制限を超えないようにしてください。

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

if (isUnexpected(response)) {
    throw response.body.error;
}

console.log(response.embedding);
console.log(response.body.model);
console.log(response.body.usage);

埋め込みを入力バッチで計算すると便利です。パラメーター inputs は、各文字列は異なる入力の、文字列のリストにすることができます。さらに、応答は埋め込みの一覧であり、各埋め込みは同じ位置の入力に対応します。

var response = await client.path("/embeddings").post({
    body: {
        input: [
            "The ultimate answer to the question of life", 
            "The largest planet in our solar system is Jupiter",
        ],
    }
});

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

if (isUnexpected(response)) {
    throw response.body.error;
}

console.log(response.embedding);
console.log(response.body.model);
console.log(response.body.usage);

ヒント

Cohere Embed V3 モデルでは、一度に 1,024 個のバッチを使用できます。バッチを作成するときは、この制限を超えないようにしてください。

さまざまな種類の埋め込みを作成する

Cohere Embed V3 モデルでは、予定している使用方法に応じて、同じ入力に対して複数の埋め込みを生成できます。この機能を使用すると、RAG パターンのより正確な埋め込みを取得できます。

次の例は、ベクターデータベースに保存されるドキュメントの埋め込みを作成するために使用される埋め込みを作成する方法を示しています。

var response = await client.path("/embeddings").post({
    body: {
        input: ["The answer to the ultimate question of life, the universe, and everything is 42"],
        input_type: "document",
    }
});

クエリでこのようなドキュメントを取得する場合は、次のコードスニペットを使用してクエリの埋め込みを作成し、検索パフォーマンスを最大化できます。

var response = await client.path("/embeddings").post({
    body: {
        input: ["What's the ultimate meaning of life?"],
        input_type: "query",
    }
});

Cohere Embed V3 モデルは、そのユースケースに基づいて埋め込みを最適化できます。

Cohere 埋め込みモデル

埋め込み用の Cohere ファミリのモデルには、次のモデルが含まれています。

Cohere Embed v3 - English
Cohere Embed v3 - Multilingual

Cohere Embed English は、セマンティック検索、検索拡張生成 (RAG)、分類、クラスタリングに使用される、テキスト表現モデルです。 Embed English は、HuggingFace (大規模なテキスト埋め込み) MTEB ベンチマークと、財務、法務、汎用コーパスなど、さまざまな業界のユースケースで優れたパフォーマンスを発揮します。 Embed English には次の属性もあります。

Embed English には 1,024 個のディメンションがあります。
モデルのコンテキストウィンドウは 512 トークンです

前提条件

Azure AI Studio で Cohere Embed V3 チャットモデルを使用するには、次の前提条件を満たす必要があります。

モデルデプロイ

サーバーレス API へのデプロイ

Cohere Embed V3 チャットモデルは、従量課金制でサーバーレス API エンドポイントにデプロイできます。この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。

サーバーレス API エンドポイントへのデプロイでは、サブスクリプションからのクォータは必要ありません。モデルがまだデプロイされていない場合は、Azure AI Studio、Azure Machine Learning SDK for Python、Azure CLI、または ARM テンプレートを使用して、モデルをサーバーレス API としてデプロイします。

サーバーレス API エンドポイントにモデルをデプロイする

REST クライアント

Azure AI モデル推論 API でデプロイされたモデルは、任意の REST クライアントを使用して実行できます。 REST クライアントを使用するには、次の前提条件が満たされている必要があります。

リクエストを作成するには、エンドポイント URL を渡す必要があります。エンドポイント URL の形式は https://your-host-name.your-azure-region.inference.ai.azure.com です。ここで、your-host-name は一意のモデルデプロイホスト名、your-azure-region はモデルがデプロイされている Azure リージョン (eastus2 など) です。
モデルデプロイと認証の設定に応じて、サービスに対する認証キーまたは Microsoft Entra ID 認証情報が必要です。キーは 32 文字の文字列です。

ヒント

さらに、Cohere は、モデルの特定の機能で使用するためにカスタマイズされた API の使用をサポートしています。モデルプロバイダー固有の API を使用するには、Cohere のドキュメントを参照してください。

埋め込みの操作

このセクションでは、埋め込みモデルと共に Azure AI モデル推論 API を使用します。

モデルを実行するクライアントを作成する

まず、モデルを実行するクライアントを作成します。次のコードでは、環境変数に格納されているエンドポイント URL とキーを使用しています。

モデルの機能を取得する

/info ルートは、エンドポイントにデプロイされたモデルに関する情報を返します。次のメソッドを呼び出してモデルの情報を返します。

GET /info HTTP/1.1
Host: <ENDPOINT_URI>
Authorization: Bearer <TOKEN>
Content-Type: application/json

応答は次のとおりです。

{
    "model_name": "Cohere-embed-v3-english",
    "model_type": "embeddings",
    "model_provider_name": "Cohere"
}

埋め込みを作成する

モデルの出力を表示する埋め込み要求を作成します。

{
    "input": [
        "The ultimate answer to the question of life"
    ]
}

ヒント

Cohere Embed V3 モデルのコンテキストウィンドウは 512 です。埋め込みを作成するときに、この制限を超えないようにしてください。

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

{
    "id": "0ab1234c-d5e6-7fgh-i890-j1234k123456",
    "object": "list",
    "data": [
        {
            "index": 0,
            "object": "embedding",
            "embedding": [
                0.017196655,
                // ...
                -0.000687122,
                -0.025054932,
                -0.015777588
            ]
        }
    ],
    "model": "Cohere-embed-v3-english",
    "usage": {
        "prompt_tokens": 9,
        "completion_tokens": 0,
        "total_tokens": 9
    }
}

埋め込みを入力バッチで計算すると便利です。パラメーター inputs は、各文字列は異なる入力の、文字列のリストにすることができます。さらに、応答は埋め込みの一覧であり、各埋め込みは同じ位置の入力に対応します。

{
    "input": [
        "The ultimate answer to the question of life", 
        "The largest planet in our solar system is Jupiter"
    ]
}

応答は次のとおりです。モデルの使用状況の統計情報が表示されます。

{
    "id": "0ab1234c-d5e6-7fgh-i890-j1234k123456",
    "object": "list",
    "data": [
        {
            "index": 0,
            "object": "embedding",
            "embedding": [
                0.017196655,
                // ...
                -0.000687122,
                -0.025054932,
                -0.015777588
            ]
        },
        {
            "index": 1,
            "object": "embedding",
            "embedding": [
                0.017196655,
                // ...
                -0.000687122,
                -0.025054932,
                -0.015777588
            ]
        }
    ],
    "model": "Cohere-embed-v3-english",
    "usage": {
        "prompt_tokens": 19,
        "completion_tokens": 0,
        "total_tokens": 19
    }
}

ヒント

Cohere Embed V3 モデルでは、一度に 1,024 個のバッチを使用できます。バッチを作成するときは、この制限を超えないようにしてください。

さまざまな種類の埋め込みを作成する

Cohere Embed V3 モデルでは、予定している使用方法に応じて、同じ入力に対して複数の埋め込みを生成できます。この機能を使用すると、RAG パターンのより正確な埋め込みを取得できます。

次の例は、ベクターデータベースに保存されるドキュメントの埋め込みを作成するために使用される埋め込みを作成する方法を示しています。

{
    "input": [
        "The answer to the ultimate question of life, the universe, and everything is 42"
    ],
    "input_type": "document"
}

クエリでこのようなドキュメントを取得する場合は、次のコードスニペットを使用してクエリの埋め込みを作成し、検索パフォーマンスを最大化できます。

{
    "input": [
        "What's the ultimate meaning of life?"
    ],
    "input_type": "query"
}

Cohere Embed V3 モデルは、そのユースケースに基づいて埋め込みを最適化できます。

説明	Language	サンプル
Web 要求	Bash	cohere-embed.ipynb
JavaScript 用 Azure AI 推論パッケージ	JavaScript	リンク
Python 用 Azure AI 推論パッケージ	Python	リンク
OpenAI SDK (試験段階)	Python	リンク
LangChain	Python	リンク
Cohere SDK	Python	リンク
LiteLLM SDK	Python	リンク

説明	パッケージ	サンプル
Cohere 埋め込みを使用してローカルの Facebook AI 類似性検索 (FAISS) ベクターインデックスを作成する - Langchain	`langchain`、`langchain_cohere`	cohere_faiss_langchain_embed.ipynb
Cohere コマンド R/R+ を使用して、ローカルの FAISS ベクターインデックスのデータから質問に回答する - Langchain	`langchain`、 `langchain_cohere`	command_faiss_langchain.ipynb
Cohere コマンド R/R+ を使用して、AI 検索ベクターインデックスのデータから質問に回答する - Langchain	`langchain`、 `langchain_cohere`	cohere-aisearch-langchain-rag.ipynb
Cohere コマンド R/R+ を使用して、AI 検索ベクターインデックスのデータから質問に回答する - Cohere SDK	`cohere`、`azure_search_documents`	cohere-aisearch-rag.ipynb
LangChain を使用したコマンド R+ ツールおよび関数呼び出し	`cohere`、`langchain`、`langchain_cohere`	command_tools-langchain.ipynb

次の方法で共有

Cohere 埋め込みモデル

前提条件

モデルデプロイ

インストールされている推論パッケージ

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

Cohere 埋め込みモデル

前提条件

モデルデプロイ

インストールされている推論パッケージ

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

Cohere 埋め込みモデル

前提条件

モデルデプロイ

REST クライアント

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

推論のその他の例

取得拡張生成 (RAG) とツールの使用サンプル

サーバーレス API エンドポイントとしてデプロイされる Cohere ファミリのモデルのコストとクォータに関する考慮事項

フィードバック

その他のリソース

次の方法で共有

Azure AI Studio で Cohere Embed V3 モデルを使用する方法

Cohere 埋め込みモデル

前提条件

モデル デプロイ

インストールされている推論パッケージ

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

Cohere 埋め込みモデル

前提条件

モデル デプロイ

インストールされている推論パッケージ

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

Cohere 埋め込みモデル

前提条件

モデル デプロイ

REST クライアント

埋め込みの操作

モデルを実行するクライアントを作成する

モデルの機能を取得する

埋め込みを作成する

さまざまな種類の埋め込みを作成する

推論のその他の例

取得拡張生成 (RAG) とツールの使用サンプル

サーバーレス API エンドポイントとしてデプロイされる Cohere ファミリのモデルのコストとクォータに関する考慮事項

関連するコンテンツ

フィードバック

その他のリソース

モデルデプロイ

モデルデプロイ

モデルデプロイ