Azure OpenAI グローバルバッチデプロイの概要 (プレビュー)

[アーティクル]
09/04/2024

Azure OpenAI Batch API は、大規模で大量の処理タスクを効率的に処理するように設計されています。個別のクォータ、24 時間のターゲットターンアラウンド、グローバルスタンダードと比較した場合の 50% 低いコストで要求の非同期グループを処理します。バッチ処理では、一度に 1 つの要求を送信するのではなく、1 つのファイル内で多数の要求を送信します。 グローバルバッチ要求には、オンラインワークロードの中断を回避する個別のエンキュートークンクォータがあります。

主なユースケースは次のとおりです。

大規模なデータ処理: 広範なデータセットを並列ですばやく分析します。
コンテンツ生成: 製品の説明や記事など、大量のテキストを作成します。
ドキュメントの校閲と要約: 長いドキュメントの校閲と要約を自動化します。
カスタマーサポートの自動化: 多数の問い合わせを同時に処理して迅速な対応を実現します。
データの抽出と分析: 膨大な量の非構造化データから情報を抽出して分析します。
自然言語処理 (NLP) タスク: 大規模なデータセットに対して感情分析や翻訳などのタスクを実行します。
マーケティングとパーソナル化: パーソナル化されたコンテンツとレコメンデーションを大規模に生成します。

重要

Microsoft は 24 時間以内にバッチ要求を処理することを目指します。それ以上の時間がかかるジョブを期限切れにすることはありません。ジョブはいつでもキャンセルできます。ジョブをキャンセルすると、残りの作業はすべてキャンセルされ、既に完了した作業があればそれが戻されます。完了した作業があればそれに対する課金が行われます。

保存されたデータは指定された Azure の地理的な場所に留まりますが、推論のためのデータ処理は任意の Azure OpenAI の場所で実行される可能性があります。 データ所在地の詳細を確認する。 

グローバルバッチのサポート

リージョンとモデルのサポート

グローバルバッチが現在サポートされているのは以下のリージョンです。

米国東部
米国西部
スウェーデン中部

以下のモデルがグローバルバッチをサポートしています。

モデル	バージョン	サポートされています
`gpt-4o`	2024-05-13	はい (テキスト + 視覚)
`gpt-4o-mini`	2024-07-18	はい (テキスト + 視覚)
`gpt-4`	turbo-2024-04-09	はい (テキストのみ)
`gpt-4`	0613	はい
`gpt-35-turbo`	0125	はい
`gpt-35-turbo`	1106	はい
`gpt-35-turbo`	0613	はい

グローバルバッチが現在サポートされているリージョン/モデルに関する最新情報についてはモデルに関するページを参照してください。

API のバージョン

2024-07-01-preview

サポートされていません

現在、以下はサポートされていません。

Assistants API との統合。
Azure OpenAI On Your Data 機能との統合。

グローバルバッチデプロイ

Studio UI では、このデプロイタイプは Global-Batch と表示されます。

ヒント

バッチ処理用の入力ファイルの各行には、グローバルバッチのデプロイ名を設定する必要がある model 属性があります。どの入力ファイルでも、すべての名前が同じデプロイ名である必要があります。これは、モデルデプロイの概念が存在しない OpenAI とは異なります。

前提条件

Azure サブスクリプション。無料で作成できます。
デプロイタイプ Global-Batch を持つモデルがデプロイされた Azure OpenAI リソース。このプロセスのヘルプについては、「リソース作成とモデルデプロイのガイド」を参照してください。

バッチファイルの準備

ファインチューニングと同様に、グローバルバッチは JSON 行 (.jsonl) 形式のファイルを使用します。さまざまな種類のサポートされるコンテンツのファイル例を以下に示します。

入力形式

{"custom_id": "task-0", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was Microsoft founded?"}]}}
{"custom_id": "task-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was the first XBOX released?"}]}}
{"custom_id": "task-2", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "What is Altair Basic?"}]}}

base64 エンコードされた画像を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type":"text","text":"Describe this picture:"},{"type":"image_url","image_url":{"url":"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABgAAAAYCAYAAADgdz34AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAAApgAAAKYB3X3/OAAAABl0RVh0U29mdHdhcmUAd3d3Lmlua3NjYXBlLm9yZ5vuPBoAAANCSURBVEiJtZZPbBtFFMZ/M7ubXdtdb1xSFyeilBapySVU8h8OoFaooFSqiihIVIpQBKci6KEg9Q6H9kovIHoCIVQJJCKE1ENFjnAgcaSGC6rEnxBwA04Tx43t2FnvDAfjkNibxgHxnWb2e/u992bee7tCa00YFsffekFY+nUzFtjW0LrvjRXrCDIAaPLlW0nHL0SsZtVoaF98mLrx3pdhOqLtYPHChahZcYYO7KvPFxvRl5XPp1sN3adWiD1ZAqD6XYK1b/dvE5IWryTt2udLFedwc1+9kLp+vbbpoDh+6TklxBeAi9TL0taeWpdmZzQDry0AcO+jQ12RyohqqoYoo8RDwJrU+qXkjWtfi8Xxt58BdQuwQs9qC/afLwCw8tnQbqYAPsgxE1S6F3EAIXux2oQFKm0ihMsOF71dHYx+f3NND68ghCu1YIoePPQN1pGRABkJ6Bus96CutRZMydTl+TvuiRW1m3n0eDl0vRPcEysqdXn+jsQPsrHMquGeXEaY4Yk4wxWcY5V/9scqOMOVUFthatyTy8QyqwZ+kDURKoMWxNKr2EeqVKcTNOajqKoBgOE28U4tdQl5p5bwCw7BWquaZSzAPlwjlithJtp3pTImSqQRrb2Z8PHGigD4RZuNX6JYj6wj7O4TFLbCO/Mn/m8R+h6rYSUb3ekokRY6f/YukArN979jcW+V/S8g0eT/N3VN3kTqWbQ428m9/8k0P/1aIhF36PccEl6EhOcAUCrXKZXXWS3XKd2vc/TRBG9O5ELC17MmWubD2nKhUKZa26Ba2+D3P+4/MNCFwg59oWVeYhkzgN/JDR8deKBoD7Y+ljEjGZ0sosXVTvbc6RHirr2reNy1OXd6pJsQ+gqjk8VWFYmHrwBzW/n+uMPFiRwHB2I7ih8ciHFxIkd/3Omk5tCDV1t+2nNu5sxxpDFNx+huNhVT3/zMDz8usXC3ddaHBj1GHj/As08fwTS7Kt1HBTmyN29vdwAw+/wbwLVOJ3uAD1wi/dUH7Qei66PfyuRj4Ik9is+hglfbkbfR3cnZm7chlUWLdwmprtCohX4HUtlOcQjLYCu+fzGJH2QRKvP3UNz8bWk1qMxjGTOMThZ3kvgLI5AzFfo379UAAAAASUVORK5CYII="}}]}],"max_tokens": 1000}}

画像 URL を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type": "text", "text": "What’s in this image?"},{"type": "image_url","image_url": {"url": "https://raw.githubusercontent.com/MicrosoftDocs/azure-docs/main/articles/ai-services/openai/media/how-to/generated-seattle.png"}}]}],"max_tokens": 1000}}

custom_id は、個々のバッチ要求の内どれが特定の応答に対応するのかを識別できるようにするために必要です。応答は、.jsonl バッチファイル内で定義されている順序と同じ順序では返されません。

model 属性は、推論応答のターゲットにしたいグローバルバッチデプロイの名前と一致するように設定する必要があります。

重要

model 属性は、推論応答のターゲットにしたいグローバルバッチデプロイの名前と一致するように設定する必要があります。 バッチファイルの各行に存在するグローバルバッチモデルデプロイ名はいずれも同じである必要があります。別のデプロイをターゲットにする場合は、別のバッチファイルまたはジョブでそれを行う必要があります。

入力ファイルを作成する

この記事では、test.jsonl という名前のファイルを作成し、上記の標準入力コードブロックからファイルに内容をコピーします。グローバルバッチデプロイ名を変更してファイルの各行に追加する必要があります。

バッチファイルをアップロードする

入力ファイルが準備できたら、まずファイルをアップロードして、バッチジョブを開始できるようにする必要があります。ファイルアップロードは、プログラム的にも Studio 経由でも実行できます。

AI Studio にサインインします。
グローバルバッチモデルデプロイを利用できる Azure OpenAI リソースを選択します。
[バッチジョブプレビュー]>[+ バッチジョブの作成] を選択します。
[バッチデータ]>[ファイルのアップロード] の下のドロップダウンから >[ファイルのアップロード] を選択して前の手順で作成した test.jsonl ファイルのパスを指定 >[次へ]。

バッチジョブを作成する

[作成] を選択してバッチジョブを開始します。

バッチジョブの進行状況を追跡する

ジョブが作成されたら、最後に作成されたジョブのジョブ ID を選択することで、ジョブの進行状況を監視できます。既定では、最後に作成したバッチジョブの状態ページが表示されます。

以下のように右側のペインで、ジョブのジョブ状態を追跡できます。

バッチジョブ出力ファイルを取得する

ジョブが完了するか、終了状態に達すると、エラーファイルと出力ファイルが生成されます。このファイルは、下矢印アイコンが付いたそれぞれのボタンを選択して、ダウンロードして確認できます。

バッチをキャンセルする

進行中のバッチをキャンセルします。バッチは、最大 10 分間状態 cancelling に留まった後 cancelled に変化し、出力ファイルには部分的な結果 (存在する場合) が出力されます。

前提条件

Azure サブスクリプション。無料で作成できます。
Python 3.8 以降のバージョン
次の Python ライブラリ: openai
Jupyter Notebook
デプロイタイプ Global-Batch を持つモデルがデプロイされた Azure OpenAI リソース。このプロセスのヘルプについては、「リソース作成とモデルデプロイのガイド」を参照してください。

この記事の手順は、Jupyter Notebook で順番に実行することを意図したものです。このため、Azure OpenAI クライアントは、例の最初に 1 回だけインスタンス化します。順番を守らずに手順を実行したい場合は、多くの場合、その呼び出しの一環として Azure OpenAI クライアントを設定する必要が生じます。

OpenAI Python ライブラリが既にインストールされている場合でも、以下のようにインストールを最新バージョンにアップグレードする必要があるかもしれません。

!pip install openai --upgrade

バッチファイルの準備

入力形式

{"custom_id": "task-0", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was Microsoft founded?"}]}}
{"custom_id": "task-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was the first XBOX released?"}]}}
{"custom_id": "task-2", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "What is Altair Basic?"}]}}

base64 エンコードされた画像を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type":"text","text":"Describe this picture:"},{"type":"image_url","image_url":{"url":"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABgAAAAYCAYAAADgdz34AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAAApgAAAKYB3X3/OAAAABl0RVh0U29mdHdhcmUAd3d3Lmlua3NjYXBlLm9yZ5vuPBoAAANCSURBVEiJtZZPbBtFFMZ/M7ubXdtdb1xSFyeilBapySVU8h8OoFaooFSqiihIVIpQBKci6KEg9Q6H9kovIHoCIVQJJCKE1ENFjnAgcaSGC6rEnxBwA04Tx43t2FnvDAfjkNibxgHxnWb2e/u992bee7tCa00YFsffekFY+nUzFtjW0LrvjRXrCDIAaPLlW0nHL0SsZtVoaF98mLrx3pdhOqLtYPHChahZcYYO7KvPFxvRl5XPp1sN3adWiD1ZAqD6XYK1b/dvE5IWryTt2udLFedwc1+9kLp+vbbpoDh+6TklxBeAi9TL0taeWpdmZzQDry0AcO+jQ12RyohqqoYoo8RDwJrU+qXkjWtfi8Xxt58BdQuwQs9qC/afLwCw8tnQbqYAPsgxE1S6F3EAIXux2oQFKm0ihMsOF71dHYx+f3NND68ghCu1YIoePPQN1pGRABkJ6Bus96CutRZMydTl+TvuiRW1m3n0eDl0vRPcEysqdXn+jsQPsrHMquGeXEaY4Yk4wxWcY5V/9scqOMOVUFthatyTy8QyqwZ+kDURKoMWxNKr2EeqVKcTNOajqKoBgOE28U4tdQl5p5bwCw7BWquaZSzAPlwjlithJtp3pTImSqQRrb2Z8PHGigD4RZuNX6JYj6wj7O4TFLbCO/Mn/m8R+h6rYSUb3ekokRY6f/YukArN979jcW+V/S8g0eT/N3VN3kTqWbQ428m9/8k0P/1aIhF36PccEl6EhOcAUCrXKZXXWS3XKd2vc/TRBG9O5ELC17MmWubD2nKhUKZa26Ba2+D3P+4/MNCFwg59oWVeYhkzgN/JDR8deKBoD7Y+ljEjGZ0sosXVTvbc6RHirr2reNy1OXd6pJsQ+gqjk8VWFYmHrwBzW/n+uMPFiRwHB2I7ih8ciHFxIkd/3Omk5tCDV1t+2nNu5sxxpDFNx+huNhVT3/zMDz8usXC3ddaHBj1GHj/As08fwTS7Kt1HBTmyN29vdwAw+/wbwLVOJ3uAD1wi/dUH7Qei66PfyuRj4Ik9is+hglfbkbfR3cnZm7chlUWLdwmprtCohX4HUtlOcQjLYCu+fzGJH2QRKvP3UNz8bWk1qMxjGTOMThZ3kvgLI5AzFfo379UAAAAASUVORK5CYII="}}]}],"max_tokens": 1000}}

画像 URL を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type": "text", "text": "What’s in this image?"},{"type": "image_url","image_url": {"url": "https://raw.githubusercontent.com/MicrosoftDocs/azure-docs/main/articles/ai-services/openai/media/how-to/generated-seattle.png"}}]}],"max_tokens": 1000}}

model 属性は、推論応答のターゲットにしたいグローバルバッチデプロイの名前と一致するように設定する必要があります。

重要

入力ファイルを作成する

この記事では、test.jsonl という名前のファイルを作成し、上記の標準入力コードブロックからそのファイルに内容をコピーします。グローバルバッチデプロイ名を変更してファイルの各行に追加する必要があります。このファイルは、Jupyter Notebook を実行しているのと同じディレクトリに保存します。

バッチファイルをアップロードする

入力ファイルが準備できたら、まずファイルをアップロードして、バッチジョブを開始できるようにする必要があります。ファイルアップロードは、プログラム的にも Studio 経由でも実行できます。この例では、キーとエンドポイントの値の代わりに環境変数を使用します。 Python で環境変数を使用する方法に慣れていない場合は、ステップバイステップで環境変数を設定するプロセスが説明されているクイックスタートのいずれかを参照してください。

重要

API キーを使用する場合は、それを Azure Key Vault などの別の場所に安全に保存します。 API キーは、コード内に直接含めないようにし、絶対に公開しないでください。

AI サービスのセキュリティの詳細については、「Azure AI サービスに対する要求の認証」を参照してください。

import os
from openai import AzureOpenAI
    
client = AzureOpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
    api_version="2024-07-01-preview",
    azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )

# Upload a file with a purpose of "batch"
file = client.files.create(
  file=open("test.jsonl", "rb"), 
  purpose="batch"
)

print(file.model_dump_json(indent=2))
file_id = file.id

出力:

{
  "id": "file-9f3a81d899b4442f98b640e4bc3535dd",
  "bytes": 815,
  "created_at": 1722476551,
  "filename": "test.jsonl",
  "object": "file",
  "purpose": "batch",
  "status": "pending",
  "status_details": null
}

ファイルアップロード状態を追跡する

アップロードファイルのサイズによっては、完全にアップロードされて処理されるのに時間がかかる場合があります。ファイルアップロード状態を確認するには、次を実行します。

# Wait until the uploaded file is in processed state
import time
import datetime 

status = "pending"
while status != "processed":
    time.sleep(15)
    file_response = client.files.retrieve(file_id)
    status = file_response.status
    print(f"{datetime.datetime.now()} File Id: {file_id}, Status: {status}")

出力:

2024-07-31 21:42:53.663655 File Id: file-9f3a81d899b4442f98b640e4bc3535dd, Status: processed

バッチジョブを作成する

processed という状態に達してファイルが正常にアップロードされたら、バッチ処理のためにそのファイルを送信できます。

# Submit a batch job with the file
batch_response = client.batches.create(
    input_file_id=file_id,
    endpoint="/chat/completions",
    completion_window="24h",
)

# Save batch ID for later use
batch_id = batch_response.id

print(batch_response.model_dump_json(indent=2))

Note

現状、完了期間は 24 時間に設定する必要があります。 24 時間以外の値を設定すると、ジョブは失敗します。 24 時間を超えるジョブは、キャンセルされるまで実行が継続されます。

出力:

{
  "id": "batch_6caaf24d-54a5-46be-b1b7-518884fcbdde",
  "completion_window": "24h",
  "created_at": 1722476583,
  "endpoint": null,
  "input_file_id": "file-9f3a81d899b4442f98b640e4bc3535dd",
  "object": "batch",
  "status": "validating",
  "cancelled_at": null,
  "cancelling_at": null,
  "completed_at": null,
  "error_file_id": null,
  "errors": null,
  "expired_at": null,
  "expires_at": 1722562983,
  "failed_at": null,
  "finalizing_at": null,
  "in_progress_at": null,
  "metadata": null,
  "output_file_id": null,
  "request_counts": {
    "completed": 0,
    "failed": 0,
    "total": 0
  }
}

バッチジョブの進行状況を追跡する

バッチジョブを正常に作成したら、Studio 内またはプログラム的に進行状況を監視できます。バッチジョブの進行状況を確認するときは、各状態呼び出しの間に少なくとも 60 秒待機することをお勧めします。

import time
import datetime 

status = "validating"
while status not in ("completed", "failed", "canceled"):
    time.sleep(60)
    batch_response = client.batches.retrieve(batch_id)
    status = batch_response.status
    print(f"{datetime.datetime.now()} Batch Id: {batch_id},  Status: {status}")

if batch_response.status == "failed":
    for error in batch_response.errors.data:  
        print(f"Error code {error.code} Message {error.message}")

出力:

2024-07-31 21:48:32.556488 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: validating
2024-07-31 21:49:39.221560 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: in_progress
2024-07-31 21:50:53.383138 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: in_progress
2024-07-31 21:52:07.274570 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: in_progress
2024-07-31 21:53:21.149501 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: finalizing
2024-07-31 21:54:34.572508 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: finalizing
2024-07-31 21:55:35.304713 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: finalizing
2024-07-31 21:56:36.531816 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: finalizing
2024-07-31 21:57:37.414105 Batch Id: batch_6caaf24d-54a5-46be-b1b7-518884fcbdde,  Status: completed

以下の状態の値があり得ます。

Status	説明
`validating`	バッチ処理を開始する前に、入力ファイルの検証が行われています。
`failed`	入力ファイルが検証プロセスに失敗しました。
`in_progress`	入力ファイルの検証が成功し、バッチが現在実行中です。
`finalizing`	バッチが完了し、結果が準備されています。
`completed`	バッチが完了し、結果の準備が整いました。
`expired`	バッチを 24 時間の時間枠内で完了できませんでした。
`cancelling`	バッチは `cancelled` の最中です (これが有効になるには最大で 10 分かかる場合があります。)
`cancelled`	バッチが `cancelled` されました。

ジョブ状態の詳細を確認するには、次を実行します。

print(batch_response.model_dump_json(indent=2))

出力:

{
  "id": "batch_6caaf24d-54a5-46be-b1b7-518884fcbdde",
  "completion_window": "24h",
  "created_at": 1722476583,
  "endpoint": null,
  "input_file_id": "file-9f3a81d899b4442f98b640e4bc3535dd",
  "object": "batch",
  "status": "completed",
  "cancelled_at": null,
  "cancelling_at": null,
  "completed_at": 1722477429,
  "error_file_id": "file-c795ae52-3ba7-417d-86ec-07eebca57d0b",
  "errors": null,
  "expired_at": null,
  "expires_at": 1722562983,
  "failed_at": null,
  "finalizing_at": 1722477177,
  "in_progress_at": null,
  "metadata": null,
  "output_file_id": "file-3304e310-3b39-4e34-9f1c-e1c1504b2b2a",
  "request_counts": {
    "completed": 3,
    "failed": 0,
    "total": 3
  }
}

error_file_id と個別の output_file_id の両方があることを確認します。 error_file_id を使用して、バッチジョブで発生する問題のデバッグを支援します。

バッチジョブ出力ファイルを取得する

import json

output_file_id = batch_response.output_file_id

if not output_file_id:
    output_file_id = batch_response.error_file_id

if output_file_id:
    file_response = client.files.content(output_file_id)
    raw_responses = file_response.text.strip().split('\n')  

    for raw_response in raw_responses:  
        json_response = json.loads(raw_response)  
        formatted_json = json.dumps(json_response, indent=2)  
        print(formatted_json)

出力:

簡潔にするために、ここでは出力のチャット補完応答の内 1 つだけを含めています。この記事の手順に従うと、以下に類似する応答が 3 つ得られるはずです。

{
  "custom_id": "task-0",
  "response": {
    "body": {
      "choices": [
        {
          "content_filter_results": {
            "hate": {
              "filtered": false,
              "severity": "safe"
            },
            "self_harm": {
              "filtered": false,
              "severity": "safe"
            },
            "sexual": {
              "filtered": false,
              "severity": "safe"
            },
            "violence": {
              "filtered": false,
              "severity": "safe"
            }
          },
          "finish_reason": "stop",
          "index": 0,
          "logprobs": null,
          "message": {
            "content": "Microsoft was founded on April 4, 1975, by Bill Gates and Paul Allen in Albuquerque, New Mexico.",
            "role": "assistant"
          }
        }
      ],
      "created": 1722477079,
      "id": "chatcmpl-9rFGJ9dh08Tw9WRKqaEHwrkqRa4DJ",
      "model": "gpt-4o-2024-05-13",
      "object": "chat.completion",
      "prompt_filter_results": [
        {
          "prompt_index": 0,
          "content_filter_results": {
            "hate": {
              "filtered": false,
              "severity": "safe"
            },
            "jailbreak": {
              "filtered": false,
              "detected": false
            },
            "self_harm": {
              "filtered": false,
              "severity": "safe"
            },
            "sexual": {
              "filtered": false,
              "severity": "safe"
            },
            "violence": {
              "filtered": false,
              "severity": "safe"
            }
          }
        }
      ],
      "system_fingerprint": "fp_a9bfe9d51d",
      "usage": {
        "completion_tokens": 24,
        "prompt_tokens": 27,
        "total_tokens": 51
      }
    },
    "request_id": "660b7424-b648-4b67-addc-862ba067d442",
    "status_code": 200
  },
  "error": null
}

その他のバッチコマンド

バッチをキャンセルする

client.batches.cancel("batch_abc123") # set to your batch_id for the job you want to cancel

バッチを一覧表示する

特定の Azure OpenAI リソースのすべてのバッチジョブを一覧表示します。

client.batches.list()

前提条件

Azure サブスクリプション。無料で作成できます。
デプロイタイプ Global-Batch を持つモデルがデプロイされた Azure OpenAI リソース。このプロセスのヘルプについては、「リソース作成とモデルデプロイのガイド」を参照してください。

バッチファイルの準備

入力形式

{"custom_id": "task-0", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was Microsoft founded?"}]}}
{"custom_id": "task-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "When was the first XBOX released?"}]}}
{"custom_id": "task-2", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are an AI assistant that helps people find information."}, {"role": "user", "content": "What is Altair Basic?"}]}}

base64 エンコードされた画像を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type":"text","text":"Describe this picture:"},{"type":"image_url","image_url":{"url":"data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABgAAAAYCAYAAADgdz34AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAAApgAAAKYB3X3/OAAAABl0RVh0U29mdHdhcmUAd3d3Lmlua3NjYXBlLm9yZ5vuPBoAAANCSURBVEiJtZZPbBtFFMZ/M7ubXdtdb1xSFyeilBapySVU8h8OoFaooFSqiihIVIpQBKci6KEg9Q6H9kovIHoCIVQJJCKE1ENFjnAgcaSGC6rEnxBwA04Tx43t2FnvDAfjkNibxgHxnWb2e/u992bee7tCa00YFsffekFY+nUzFtjW0LrvjRXrCDIAaPLlW0nHL0SsZtVoaF98mLrx3pdhOqLtYPHChahZcYYO7KvPFxvRl5XPp1sN3adWiD1ZAqD6XYK1b/dvE5IWryTt2udLFedwc1+9kLp+vbbpoDh+6TklxBeAi9TL0taeWpdmZzQDry0AcO+jQ12RyohqqoYoo8RDwJrU+qXkjWtfi8Xxt58BdQuwQs9qC/afLwCw8tnQbqYAPsgxE1S6F3EAIXux2oQFKm0ihMsOF71dHYx+f3NND68ghCu1YIoePPQN1pGRABkJ6Bus96CutRZMydTl+TvuiRW1m3n0eDl0vRPcEysqdXn+jsQPsrHMquGeXEaY4Yk4wxWcY5V/9scqOMOVUFthatyTy8QyqwZ+kDURKoMWxNKr2EeqVKcTNOajqKoBgOE28U4tdQl5p5bwCw7BWquaZSzAPlwjlithJtp3pTImSqQRrb2Z8PHGigD4RZuNX6JYj6wj7O4TFLbCO/Mn/m8R+h6rYSUb3ekokRY6f/YukArN979jcW+V/S8g0eT/N3VN3kTqWbQ428m9/8k0P/1aIhF36PccEl6EhOcAUCrXKZXXWS3XKd2vc/TRBG9O5ELC17MmWubD2nKhUKZa26Ba2+D3P+4/MNCFwg59oWVeYhkzgN/JDR8deKBoD7Y+ljEjGZ0sosXVTvbc6RHirr2reNy1OXd6pJsQ+gqjk8VWFYmHrwBzW/n+uMPFiRwHB2I7ih8ciHFxIkd/3Omk5tCDV1t+2nNu5sxxpDFNx+huNhVT3/zMDz8usXC3ddaHBj1GHj/As08fwTS7Kt1HBTmyN29vdwAw+/wbwLVOJ3uAD1wi/dUH7Qei66PfyuRj4Ik9is+hglfbkbfR3cnZm7chlUWLdwmprtCohX4HUtlOcQjLYCu+fzGJH2QRKvP3UNz8bWk1qMxjGTOMThZ3kvgLI5AzFfo379UAAAAASUVORK5CYII="}}]}],"max_tokens": 1000}}

画像 URL を使用した入力

{"custom_id": "request-1", "method": "POST", "url": "/chat/completions", "body": {"model": "REPLACE-WITH-MODEL-DEPLOYMENT-NAME", "messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": [{"type": "text", "text": "What’s in this image?"},{"type": "image_url","image_url": {"url": "https://raw.githubusercontent.com/MicrosoftDocs/azure-docs/main/articles/ai-services/openai/media/how-to/generated-seattle.png"}}]}],"max_tokens": 1000}}

model 属性は、推論応答のターゲットにしたいグローバルバッチデプロイの名前と一致するように設定する必要があります。

重要

入力ファイルを作成する

この記事では、test.jsonl という名前のファイルを作成し、上記の標準入力コードブロックからそのファイルに内容をコピーします。グローバルバッチデプロイ名を変更してファイルの各行に追加する必要があります。

バッチファイルをアップロードする

重要

AI サービスのセキュリティの詳細については、「Azure AI サービスに対する要求の認証」を参照してください。

curl -X POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/files?api-version=2024-07-01-preview \
  -H "Content-Type: multipart/form-data" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -F "purpose=batch" \
  -F "file=@C:\\batch\\test.jsonl;type=application/json"

上記のコードでは、test.jsonl ファイルの特定のファイルパスを想定しています。ローカルシステムでの必要性に応じて、このファイルパスを調整してください。

出力:

{
  "status": "pending",
  "bytes": 686,
  "purpose": "batch",
  "filename": "test.jsonl",
  "id": "file-21006e70789246658b86a1fc205899a4",
  "created_at": 1721408291,
  "object": "file"
}

ファイルアップロード状態を追跡する

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/files/{file-id}?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY"

出力:

{
  "status": "processed",
  "bytes": 686,
  "purpose": "batch",
  "filename": "test.jsonl",
  "id": "file-21006e70789246658b86a1fc205899a4",
  "created_at": 1721408291,
  "object": "file"
}

バッチジョブを作成する

processed という状態に達してファイルが正常にアップロードされたら、バッチ処理のためにそのファイルを送信できます。

curl -X POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/batches?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "input_file_id": "file-abc123",
    "endpoint": "/chat/completions",
    "completion_window": "24h"
  }'

Note

出力:

{
  "cancelled_at": null,
  "cancelling_at": null,
  "completed_at": null,
  "completion_window": "24h",
  "created_at": "2024-07-19T17:13:57.2491382+00:00",
  "error_file_id": null,
  "expired_at": null,
  "expires_at": "2024-07-20T17:13:57.1918498+00:00",
  "failed_at": null,
  "finalizing_at": null,
  "id": "batch_fe3f047a-de39-4068-9008-346795bfc1db",
  "in_progress_at": null,
  "input_file_id": "file-21006e70789246658b86a1fc205899a4",
  "errors": null,
  "metadata": null,
  "object": "batch",
  "output_file_id": null,
  "request_counts": {
    "total": null,
    "completed": null,
    "failed": null
  },
  "status": "Validating"
}

バッチジョブの進行状況を追跡する

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/batches/{batch_id}?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY"

出力:

{
  "cancelled_at": null,
  "cancelling_at": null,
  "completed_at": null,
  "completion_window": "24h",
  "created_at": "2024-07-19T17:33:29.1619286+00:00",
  "error_file_id": null,
  "expired_at": null,
  "expires_at": "2024-07-20T17:33:29.1578141+00:00",
  "failed_at": null,
  "finalizing_at": null,
  "id": "batch_e0a7ee28-82c4-46a2-a3a0-c13b3c4e390b",
  "in_progress_at": null,
  "input_file_id": "file-c55ec4e859d54738a313d767718a2ac5",
  "errors": null,
  "metadata": null,
  "object": "batch",
  "output_file_id": null,
  "request_counts": {
    "total": null,
    "completed": null,
    "failed": null
  },
  "status": "Validating"
}

以下の状態の値があり得ます。

Status	説明
`validating`	バッチ処理を開始する前に、入力ファイルの検証が行われています。
`failed`	入力ファイルが検証プロセスに失敗しました。
`in_progress`	入力ファイルの検証が成功し、バッチが現在実行中です。
`finalizing`	バッチが完了し、結果が準備されています。
`completed`	バッチが完了し、結果の準備が整いました。
`expired`	バッチを 24 時間の時間枠内で完了できませんでした。
`cancelling`	バッチは `cancelled` の最中です (これが有効になるには最大で 10 分かかる場合があります。)
`cancelled`	バッチが `cancelled` されました。

バッチジョブ出力ファイルを取得する

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/files/{output_file_id}/content?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY"  > batch_output.jsonl

その他のバッチコマンド

バッチをキャンセルする

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/batches/{batch_id}/cancel?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY"

バッチを一覧表示する

特定の Azure OpenAI リソースの既存のバッチジョブすべてを一覧表示します。

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/batches?api-version=2024-07-01-preview \
  -H "api-key: $AZURE_OPENAI_API_KEY"

グローバルバッチ制限

制限名	制限値
リソースあたりの最大ファイル数	500
最大入力ファイルサイズ	200 MB
ファイルあたりの最大要求数	100,000

グローバルバッチクォータ

次の表はバッチのクォータ制限を示したものです。グローバルバッチのクォータ値は、エンキューされたトークンの数で表されます。バッチ処理用のファイルを送信すると、ファイル内に存在するトークンの数がカウントされます。バッチジョブが終了状態になるまで、これらのトークンはエンキューされたトークンの合計の制限に対してカウントされます。

モデル	エンタープライズ契約	既定値	月単位のクレジットカードベースのサブスクリプション	MSDN サブスクリプション	Microsoft Azure for Students、無料試用版
`gpt-4o`	5 B	50 M	1.35 M	90 K	該当なし
`gpt-4o-mini`	5 B	50 M	1.35 M	90 K	該当なし
`gpt-4-turbo`	300 M	40 M	1.35 M	90 K	該当なし
`gpt-4`	150 M	5 M	200 K	100 K	該当なし
`gpt-35-turbo`	10 B	100 M	5 M	2 M	50 K

B = 10 億 | M = 100万 | K = 1,000

バッチオブジェクト

プロパティ	Type	Definition
`id`	string
`object`	string	`batch`
`endpoint`	string	バッチによって使用される API エンドポイント
`errors`	オブジェクト
`input_file_id`	string	バッチの入力ファイルの ID
`completion_window`	string	バッチを処理する時間枠
`status`	string	バッチの現在の状態。指定できる値: `validating`、`failed`、`in_progress`、`finalizing`、`completed`、`expired`、`cancelling`、`cancelled`。
`output_file_id`	string	正常に実行された要求の出力を含むファイルの ID。
`error_file_id`	string	エラーが発生した要求の出力を含むファイルの ID。
`created_at`	integer	このバッチが作成された時点のタイムスタンプ (unix エポック)。
`in_progress_at`	integer	このバッチが進行状態になった時点のタイムスタンプ (unix エポック)。
`expires_at`	integer	このバッチの有効期限が切れる時点のタイムスタンプ (unix エポック)。
`finalizing_at`	integer	このバッチが終了処理を開始した時点のタイムスタンプ (unix エポック)。
`completed_at`	integer	このバッチが終了処理を開始した時点のタイムスタンプ (unix エポック)。
`failed_at`	integer	このバッチが失敗した時点のタイムスタンプ (unix エポック)
`expired_at`	integer	このバッチの有効期限が切れた時点のタイムスタンプ (unix エポック)。
`cancelling_at`	integer	このバッチが `cancelling` を開始した時点のタイムスタンプ (unix エポック)。
`cancelled_at`	integer	このバッチが `cancelled` された時点のタイムスタンプ (unix エポック)。
`request_counts`	オブジェクト	オブジェクト構造: `total` integer バッチ内の要求の合計数。 `completed` integer バッチ内で正常に完了した要求の数。 `failed` integer バッチ内の失敗した要求の数。
`metadata`	map	バッチにアタッチできるキーと値のペアのセット。これは、バッチに関する追加情報を構造化された形式で保存する上で役立ちます。

よく寄せられる質問 (FAQ)

バッチ API では画像を使用できますか?

この機能は、一部のマルチモーダルモデルに限定されます。現在、バッチ要求の一部として画像をサポートしているのは GPT-4o だけです。画像は、画像 URL または画像の base64 エンコード表現のどちらかを介して入力として指定できます。バッチでの画像は、GPT-4 Turbo では現在サポートされていません。

ファインチューニングされたモデルでバッチ API を使用できますか?

現在これはサポートされていません。

埋め込みモデルに対してバッチ API を使用できますか?

現在これはサポートされていません。

コンテンツフィルタリングはグローバルバッチデプロイで機能しますか?

はい。他のデプロイタイプと同様に、コンテンツフィルターを作成し、それらをグローバルバッチデプロイタイプに関連付けることができます。

追加のクォータを要求できますか?

はい。Studio UI のクォータページから可能です。既定のクォータ割り当ては、クォータと制限に関する記事で確認できます。

API が 24 時間の時間枠内に要求を完了しなかった場合は何が起きますか?

Microsoft はこれらの要求を 24 時間以内に処理することを目指します。それ以上の時間がかかるジョブを期限切れにすることはありません。ジョブはいつでもキャンセルできます。ジョブをキャンセルすると、残りの作業はすべてキャンセルされ、既に完了した作業があればそれが戻されます。完了した作業があればそれに対する課金が行われます。

バッチを使用してエンキューできる要求の数はいくつですか?

バッチ処理できる要求の数には固定の制限はなく、この数はエンキューされたトークンクォータによって決まります。エンキューされたトークンクォータには、一度にエンキューできる入力トークンの最大数が含まれます。

バッチ要求が完了すると、入力トークンがクリアされるため、バッチレート制限がリセットされます。この制限は、キュー内のグローバル要求の数によって決まります。 Batch API キューがバッチを迅速に処理する場合、バッチレート制限はより迅速にリセットされます。

トラブルシューティング

status が Completed である場合、ジョブは成功しています。成功したジョブが error_file_id を生成することもありますが、これは 0 バイトの空ファイルに関連付けられます。

ジョブの失敗が発生した場合は、以下のように errors プロパティ内で失敗の詳細を確認できます。

"value": [
        {
          "id": "batch_80f5ad38-e05b-49bf-b2d6-a799db8466da",
          "completion_window": "24h",
          "created_at": 1725419394,
          "endpoint": "/chat/completions",
          "input_file_id": "file-c2d9a7881c8a466285e6f76f6321a681",
          "object": "batch",
          "status": "failed",
          "cancelled_at": null,
          "cancelling_at": null,
          "completed_at": 1725419955,
          "error_file_id": "file-3b0f9beb-11ce-4796-bc31-d54e675f28fb",
          "errors": {
                "object": “list”,
                "data": [
                {
               “code”: “empty_file”,
               “message”: “The input file is empty. Please ensure that the batch contains at least one   request.”
                    }
                ]
          },
          "expired_at": null,
          "expires_at": 1725505794,
          "failed_at": null,
          "finalizing_at": 1725419710,
          "in_progress_at": 1725419572,
          "metadata": null,
          "output_file_id": "file-ef12af98-dbbc-4d27-8309-2df57feed572",

            "request_counts": {
                "total": 10,
                "completed": null,
                "failed": null
            },
        }

エラーコード

エラーコード	Definition
`invalid_json_line`	入力ファイル内の 1 つ (または複数) の行が有効な JSON として解析できませんでした。 JSON 標準に従って入力ミス、適切な開始角かっこ、終わり角かっこ、引用符がないことを確認し、要求を再送信してください。
`too_many_tasks`	入力ファイル内の要求の数が、許容される最大値である 100,000 を超えています。要求の合計が 100,000 以下であることを確認し、ジョブを再送信してください。
`url_mismatch`	入力ファイル内に他の行と一致しない URL を持つ行が存在するか、入力ファイル内で指定された URL が想定されるエンドポイント URL と一致しません。すべての要求 URL が同じであり、それが Azure OpenAI デプロイに関連付けられているエンドポイント URL と一致することを確認してください。
`model_not_found`	入力ファイルの `model` プロパティで指定された Azure OpenAI モデルのデプロイ名が見つかりませんでした。この名前が有効な Azure OpenAI モデルデプロイを指していることを確認してください。
`duplicate_custom_id`	この要求のカスタム ID は、別の要求のカスタム ID と重複しています。
`empty_batch`	入力ファイルをチェックして、バッチ内の各要求のカスタム ID パラメーターが一意であることを確認してください。
`model_mismatch`	入力ファイルのこの要求の `model` プロパティで指定された Azure OpenAI モデルのデプロイ名が、ファイルの残りの部分のものと一致しません。バッチ内のすべての要求が、要求の `model` プロパティ内で同じ AOAI モデルデプロイを指していることを確認してください。
`invalid_request`	入力行のスキーマが無効であるか、デプロイ SKU が無効です。入力ファイル内の要求のプロパティが想定される入力プロパティと一致していること、および Azure OpenAI デプロイ SKU がバッチ API 要求に対する `globalbatch` であることを確認してください。

既知の問題

Azure CLI を使用してデプロイされたリソースは、そのままでは Azure OpenAI グローバルバッチで機能しません。この原因は、このメソッドを使用してデプロイされたリソースは https://your-resource-name.openai.azure.com パターンに従わないエンドポイントサブドメインを持つという問題にあります。この問題の回避策は、デプロイプロセスの一環としてサブドメインのセットアップを適切に処理する他の一般的なデプロイ方法のいずれかを使用して、新しい Azure OpenAI リソースをデプロイすることです。

次の方法で共有

Azure OpenAI グローバル バッチ デプロイの概要 (プレビュー)

グローバル バッチのサポート

リージョンとモデルのサポート

API のバージョン

サポートされていません

グローバル バッチ デプロイ

前提条件

バッチ ファイルの準備

入力形式

入力ファイルを作成する

バッチ ファイルをアップロードする

バッチ ジョブを作成する

バッチ ジョブの進行状況を追跡する

バッチ ジョブ出力ファイルを取得する

バッチをキャンセルする

前提条件

バッチ ファイルの準備

入力形式

入力ファイルを作成する

バッチ ファイルをアップロードする

ファイル アップロード状態を追跡する

バッチ ジョブを作成する

バッチ ジョブの進行状況を追跡する

バッチ ジョブ出力ファイルを取得する

その他のバッチ コマンド

バッチをキャンセルする

バッチを一覧表示する

前提条件

バッチ ファイルの準備

入力形式

入力ファイルを作成する

バッチ ファイルをアップロードする

ファイル アップロード状態を追跡する

バッチ ジョブを作成する

バッチ ジョブの進行状況を追跡する

バッチ ジョブ出力ファイルを取得する

その他のバッチ コマンド

バッチをキャンセルする

バッチを一覧表示する

グローバル バッチ制限

グローバル バッチ クォータ

バッチ オブジェクト

よく寄せられる質問 (FAQ)

バッチ API では画像を使用できますか?

ファインチューニングされたモデルでバッチ API を使用できますか?

埋め込みモデルに対してバッチ API を使用できますか?

コンテンツ フィルタリングはグローバル バッチ デプロイで機能しますか?

追加のクォータを要求できますか?

API が 24 時間の時間枠内に要求を完了しなかった場合は何が起きますか?

バッチを使用してエンキューできる要求の数はいくつですか?

トラブルシューティング

エラー コード

既知の問題

関連項目

フィードバック

その他のリソース

Azure OpenAI グローバルバッチデプロイの概要 (プレビュー)

グローバルバッチのサポート

グローバルバッチデプロイ

バッチファイルの準備

バッチファイルをアップロードする

バッチジョブを作成する

バッチジョブの進行状況を追跡する

バッチジョブ出力ファイルを取得する

バッチファイルの準備

バッチファイルをアップロードする

ファイルアップロード状態を追跡する

バッチジョブを作成する

バッチジョブの進行状況を追跡する

バッチジョブ出力ファイルを取得する

その他のバッチコマンド

バッチファイルの準備

バッチファイルをアップロードする

ファイルアップロード状態を追跡する

バッチジョブを作成する

バッチジョブの進行状況を追跡する

バッチジョブ出力ファイルを取得する

その他のバッチコマンド

グローバルバッチ制限

グローバルバッチクォータ

バッチオブジェクト

コンテンツフィルタリングはグローバルバッチデプロイで機能しますか?

エラーコード