Azure OpenAI Service の新機能

この記事では、Azure OpenAI の最新リリースと主要なドキュメント更新の概要を示します。

2024 年 6 月

提供終了日の更新

  • gpt-35-turbo 0301 の提供終了日を、2024 年 10 月 1 日以降に更新しました。
  • gpt-35-turbogpt-35-turbo-16k 0613 の提供終了日を、2024 年 10 月 1 日に更新しました。
  • gpt-4gpt-4-32k 0314 の非推奨となる日を 2024 年 10 月 1 日に、提供終了日を 2025 年 6 月 6 日に更新しました。

モデルの非推奨と提供終了に関する最新情報については、「モデル提供終了ガイド」を参照してください。

微調整のためのトークン ベース課金

  • Azure OpenAI の微調整課金は、トレーニングの総経過時間ではなく、トレーニング ファイルのトークンの数に基づくようになりました。 これにより、一部のトレーニング実行のコストが大幅に削減され、微調整コストの見積もりがはるかに簡単になります。 詳細については、公式発表を参照してください。

新しいリージョンで GPT-4o がリリースされました

  • GPT-4o は、次のリージョンでも使用できるようになりました。
    • 標準のリージョン デプロイ用のスウェーデン中部。
    • プロビジョニングされたデプロイ用のオーストラリア東部、カナダ東部、東日本、韓国中部、スウェーデン中部、スイス北部、および米国西部 3。

モデルの提供状況に関する最新情報については、モデルのページを参照してください。

Assistants 用のカスタマー マネージド キー (CMK) のサポート

Assistants のスレッドとファイルで、次のリージョンの CMK がサポートされるようになりました。

  • 米国西部 3

2024 年 5 月

GPT-4o プロビジョニング済みデプロイ

gpt-4o バージョン: 2024-05-13 は、標準デプロイとプロビジョニングされたデプロイの両方で使用できます。 プロビジョニング済みと標準のモデル デプロイでは、テキストと画像/ビジョンの両方の推論要求を受け入れます。 リージョン別のモデルの提供状況については、プロビジョニングされたデプロイのモデル マトリックスを参照してください。

Assistants v2 (プレビュー)

Assistants API の更新が一般公開されました。 次の更新が含まれています。

  • ファイル検索ツールとベクトル ストレージ
  • トークン使用の管理のために最大完了トークンと最大プロンプト トークンをサポート
  • 指定したツールを使用するようアシスタントに強制する tool_choice パラメーターアシスタント ロールでメッセージを作成して、スレッドのカスタム会話履歴を作成できるようになりました。
  • temperaturetop_presponse_formatパラメーターのサポート。
  • ストリーミングとポーリングのサポート。 Python SDK のヘルパー関数を使用して、実行とストリーム応答を作成できます。 ポーリング不要でオブジェクトの状態の更新を共有できるポーリング SDK ヘルパーも追加されました。
  • Azure OpenAI Studio を使用した Logic Apps と関数呼び出しの実験。 Logic Apps に実装されている REST API を関数としてインポートすると、Studio はユーザー プロンプトに基づいて、関数を (Logic Apps ワークフローとして) 自動的に呼び出します。
  • AutoGen by Microsoft Research では、幅広いアプリケーションで大規模言語モデル (LLM) ワークフローを手軽に構築できるマルチエージェント会話フレームワークが提供されます。 Azure OpenAI アシスタントは、アシスタントを AutoGen ベースのマルチエージェント ワークフローにシームレスに追加できる、新しい実験的なエージェントである GPTAssistantAgent を介して AutoGen に統合されました。 これにより、タスクやドメインに特化した複数の Azure OpenAI アシスタントを協働させて、複雑なタスクに取り組めます。
  • 微調整された gpt-3.5-turbo-0125 モデルが次のリージョンでサポートされます。
    • 米国東部 2
    • スウェーデン中部
  • 次のリージョンでリージョン サポートが展開されました。
    • 東日本
    • 英国南部
    • 米国西部
    • 米国西部 3
    • ノルウェー東部

詳細については、アシスタントに関するブログ記事を参照してください。

GPT-4o モデルの一般提供 (GA)

GPT-4o ("o" は "オムニ" の意) は、2024 年 5 月 13 日に発表された OpenAI の最新モデルです。

  • GPT-4o はテキストと画像を 1 つのモデルに統合し、複数のデータ型を同時に処理できるようにします。 このマルチモーダル アプローチにより、人間とコンピューターの対話における精度と応答性が向上します。
  • GPT-4o は、英語以外の言語とビジョン タスクで優れたパフォーマンスを提供しながら、英語のテキストとコーディング タスクにおいて GPT-4 Turbo に匹敵し、AI 機能の新しいベンチマークを設定します。

リージョン別のモデルの提供状況については、モデルのページを参照してください。

グローバル標準の展開の種類 (プレビュー)

グローバル展開は、非グローバル オファーと同じ Azure OpenAI リソースで利用できます。ただし、Azure のグローバル インフラストラクチャを利用して、トラフィックを要求ごとに最適な可用性のデータ センターに動的にルーティングできます。 グローバル標準では、新しいモデルに対して最大の既定クォータが提供され、複数のリソース間での負荷分散の必要がなくなります。

詳細については、「展開の種類 ガイド」を参照してください。

微調整に関する更新

DALL-E および GPT-4 Turbo Vision GA の構成可能なコンテンツ フィルター

DALL-E 2 および 3、GPT-4 Turbo with Vision GA (gpt-4-turbo-2024-04-09)、GPT-4o のデプロイ用のカスタム コンテンツ フィルターを作成できます。 コンテンツのフィルター処理

すべての Azure OpenAI カスタマーが利用できる非同期フィルター

ストリーミング シナリオでの待機時間を改善するための、フィルターの非同期的な実行を、すべての Azure OpenAI カスタマーが利用できるようになりました。 コンテンツのフィルター処理

プロンプト シールド

プロンプト シールドは、Azure OpenAI モデルを利用するアプリケーションを、直接攻撃 (ジェイルブレイク) と間接攻撃の 2 種類の攻撃から保護します。 間接攻撃 (間接プロンプト攻撃またはクロスドメイン プロンプトインジェクション攻撃とも呼ばれます) は、生成 AI モデルを搭載したシステムに対する攻撃の一種で、アプリケーション開発者やユーザーが直接作成していない情報をアプリケーションが処理するときに発生する可能性があります。 コンテンツのフィルター処理

2024-05-01-preview API リリース

GPT-4 Turbo モデルの一般提供 (GA)

GPT-4 Turbo の最新 GA リリースは次のとおりです。

  • gpt-4バージョン:turbo-2024-04-09

これは、次のプレビュー モデルに代わるものです。

  • gpt-4バージョン:1106-Preview
  • gpt-4バージョン:0125-Preview
  • gpt-4バージョン:vision-preview

OpenAI と Azure OpenAI GPT-4 Turbo GA モデルの違い

  • OpenAI の最新の 0409 ターボ モデル バージョンでは、すべての推論要求に対して JSON モードと関数呼び出しがサポートされています。
  • Azure OpenAI の最新の turbo-2024-04-09 バージョンでは、現在、画像 (ビジョン) 入力による推論要求を行う場合、JSON モードと関数呼び出しの使用はサポートされていません。 テキスト ベース入力の要求 (image_url とインライン イメージがない要求) では、JSON モードと関数呼び出しがサポートされています。

gpt-4 vision-preview との違い

  • Azure AI 固有の Vision 拡張機能と GPT-4 Turbo with Vision の統合は、gpt-4 バージョン:turbo-2024-04-09 ではサポートされていません。 これには、光学式文字認識 (OCR)、オブジェクト グラウンディング、ビデオ プロンプト、画像を含むデータの処理の改善が含まれます。

GPT-4 Turbo のプロビジョニングされたマネージド可用性

  • gpt-4バージョン:turbo-2024-04-09 は、標準デプロイとプロビジョニングされたデプロイの両方で使用できます。 現在、このモデルのプロビジョニングされたバージョンでは、イメージ/ビジョン推論要求はサポートされていません。 このモデルのプロビジョニングされたデプロイでは、テキスト入力のみ受け入れます。 標準のモデル デプロイでは、テキストと画像/ビジョンの両方の推論要求を受け入れます。

利用可能なリージョン

リージョン別のモデルの提供状況については、標準プロビジョニングされたデプロイのモデル マトリックスを参照してください。

GPT-4 Turbo with Vision GA のデプロイ

Studio UI から GA モデルをデプロイするには、GPT-4 を選択し、ドロップダウン メニューから turbo-2024-04-09 バージョンを選択します。 gpt-4-turbo-2024-04-09 モデルの既定のクォータは、GPT-4-Turbo の現在のクォータと同じになります。 リージョンのクォータ制限を参照してください。

2024 年 4 月

米国東部 2 とスイス西部という 2 つの新しいリージョンで微調整がサポートされるようになりました

次の機能をサポートする微調整が利用できるようになりました。

米国東部 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

スイス西部

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

各リージョンでのモデルの提供状況とファインチューニングのサポートに関する最新情報は、モデルのページをご確認ください。

マルチターン チャット トレーニング例

微調整でマルチターン チャット トレーニング例がサポートされるようになりました。

GPT-4 (0125) は Azure OpenAI On Your Data で使用できます

Azure OpenAI on Your Data を使用して対応リージョンで GPT-4 (0125) モデルを使用できるようになりました。

2024 年 3 月

Azure OpenAI Studio でのリスクと安全性の監視

Azure OpenAI Studio では、コンテンツ フィルター構成を使用するデプロイごとにリスクと安全性のダッシュボードが提供されるようになりました。 これを使用して、フィルター処理アクティビティの結果を確認します。 その後、フィルター構成を調整して、より適切にビジネス ニーズに対応し、責任ある AI 原則を満たすことができます。

リスクと安全性の監視の使用

Azure OpenAI On Your Data の更新

  • Azure OpenAI On Your Data で使用する Elasticsearch ベクトル データベースに接続できるようになりました。
  • データ インジェスト中にチャンク サイズ パラメーターを使用して、インデックス内の特定のデータ チャンクのトークンの最大数を設定できます。

2024-02-01 一般提供 (GA) API がリリースされました

これは最新の GA API リリースであり、以前の 2023-05-15 GA API リリースに代わるものです。 このリリースには、データなどに対する Whisper、DALL-3、微調整などの最新の Azure OpenAI GA 機能のサポートが含まれています。

アシスタント、テキスト読み上げ (TTS)、データ データソース上の特定の機能など、まだプレビュー段階にある機能は、引き続きプレビュー API バージョンが必要です。 詳細については、API バージョンのライフサイクル ガイドを参照してください。

Whisper 一般提供 (GA)

Whisper 音声テキスト変換モデルは、REST と Python の両方で GA になりました。 クライアント ライブラリ SDK は現在、パブリック プレビュー段階にあります。

クイックスタートに従って、Whisper をお試しください。

DALL-E 3 一般提供 (GA)

DALL-E 3 画像生成モデルは、REST と Python の両方で GA になりました。 クライアント ライブラリ SDK は現在、パブリック プレビュー段階にあります。

クイックスタートに従って、DALL-E 3 をお試しください。

DALL-E 3 の新しいリージョン サポート

SwedenCentral に加え、East USAustraliaEast の Azure リージョンでも、Azure OpenAI リソースで DALL-E 3 にアクセスできるようになりました。

モデルの非推奨と提供終了

Azure OpenAI Service でのモデルの非推奨と提供終了 を追跡するページが追加されました。 このページでは、現在使用可能、非推奨、提供終了のモデルに関する情報を提供します。

2024-03-01-preview API がリリースされました

2024-03-01-preview は、 2024-02-15-preview と同じ機能をすべて備えており、埋め込み用の以下の 2 つの新しいパラメータが追加されています。

  • encoding_format では、埋め込みを生成する形式を float または base64 で指定できます。 既定値は、float です。
  • dimensions では、出力される埋め込みの数を設定できます。 このパラメータは、新しい第 3 世代埋め込みモデル (text-embedding-3-large および text-embedding-3-small) でのみサポートされています。 通常、埋め込みが大きくなると、コンピューティング、メモリ、ストレージの観点からコストが高くなります。 ディメンション数を調整できるので、全体的なコストとパフォーマンスをより詳細に制御できます。 dimensions パラメーターは OpenAI 1.x Python ライブラリのすべてのバージョンでサポートされているわけではありません。このパラメーターを利用するには、最新バージョンの pip install openai --upgrade にアップグレードすることをお勧めします。

現在、プレビュー API バージョンを使用して最新の機能を利用している場合は、API バージョンのライフサイクルに関する記事を参照して、現在お使いの API バージョンのサポート期間を確認することをお勧めします。

GPT-4-1106-Preview アップグレード プランの更新

2024 年 3 月 8 日に予定されていた gpt-4 1106-Preview から gpt-4 0125-Preview へのデプロイ アップグレードは行われなくなりました。 "自動更新を既定にする" と "期限切れになったときにアップグレードする" に設定された gpt-4 バージョン 1106-Preview と 0125-Preview のデプロイは、安定バージョンのモデルがリリースされた後にアップグレードが開始されます。

アップグレード プロセスの詳細については、 モデルに関するページを参照してください。

2024 年 2 月

GPT-3.5-turbo-0125 モデルが利用可能になりました

このモデルではさまざまな機能強化が組み込まれました。たとえば、要求された形式での応答精度の向上、英語以外の言語の関数呼び出しに対してテキスト エンコードの問題が発生していたバグの修正などです。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

利用可能な第 3 世代埋め込みモデル

  • text-embedding-3-large
  • text-embedding-3-small

OpenAI の報告によると、テストでは、大規模と小規模の第 3 世代埋め込みモデルのいずれも、MIRACL ベンチマークで多言語検索の平均パフォーマンスが向上しており、さらに MTEB ベンチマークで、第 2 世代の text-embedding-ada-002 モデルよりも優れた英語タスクのパフォーマンスを維持しています。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

GPT-3.5 Turbo のクォータ統合

異なるバージョンの GPT-3.5-Turbo モデル (16k を含む) 間の移行を簡略化するために、すべての GPT-3.5-Turbo クォータを 1 つのクォータ値に統合します。

  • クォータの引き上げが承認されたお客様は、以前の引き上げを反映した統合された合計クォータを保有します。

  • モデル バージョン全体の現在の合計使用量が既定値より少ないお客様は、統合された新しい合計クォータを既定で取得します。

GPT-4-0125-preview モデルが利用可能

gpt-4 モデルのバージョン 0125-preview が、米国東部、米国中北部、米国中南部の各リージョンの Azure OpenAI Service で利用できるようになりました。 gpt-4 バージョン 1106-previewのデプロイを使用しているお客様は、今後数週間以内に 0125-preview に自動的にアップグレードされます。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

Assistants API パブリック プレビュー

Azure OpenAI では、OpenAI の GPT を利用できる API がサポートされるようになりました。 Azure OpenAI Assistants (プレビュー) を使用すると、カスタム命令やコード インタープリターなどの高度なツール、およびカスタム関数を使用して、自分のニーズに合わせて調整された AI アシスタントを作成できます。 詳細については、以下をご覧ください。

OpenAI テキスト読み上げ音声パブリック プレビュー

Azure OpenAI Service では、OpenAI の音声を使用したテキスト読み上げ API がサポートされるようになりました。 指定したテキストから AI で生成された音声を取得します。 詳細については、「概要ガイド」を参照し、「クイックスタート」を試してください。

Note

Azure AI 音声でも、OpenAI のテキスト読み上げ音声がサポートされています。 詳細については、「Azure OpenAI Service または Azure AI 音声を介した OpenAI テキスト読み上げ音声」ガイドを参照してください。

新しいファインチューニング機能とモデルのサポート

独自のデータに基づく Azure OpenAI の新しいリージョン サポート

これで、次の Azure リージョンで Azure OpenAI On Your Data を使用できるようになりました。

  • 南アフリカ北部

Azure OpenAI On Your Data の一般提供

2023 年 12 月

Azure OpenAI On Your Data

  • ストレージ アカウント、Azure OpenAI リソース、Azure AI 検索サービス リソースのセキュリティ サポートなど、Azure OpenAI On Your Data に対する VPN とプライベート エンドポイントの完全なサポート。
  • 仮想ネットワークとプライベート エンドポイントを使用してデータを保護することで、Azure OpenAI On Your Data を安全に使用するための新しい記事。

GPT-4 Turbo with Vision が利用可能

Azure OpenAI サービスの GPT-4 Turbo with Vision はパブリック プレビュー中です。 GPT-4 Turbo with Vision は、OpenAI によって開発された大規模なマルチモーダル モデル (LMM) であり、画像を分析し、それらに関する質問に対してテキストでの応答を提供できます。 自然言語処理とビジュアル解釈の両方が組み込まれています。 拡張モードでは、Azure AI Vision 機能を使用して、画像から追加の分析情報を生成できます。

  • Azure OpenAI Playground を使用して、ノー コード エクスペリエンスで GPT-4 Turbo with Vision の機能を探索します。 詳細については、クイック スタート ガイドを参照してください。
  • GPT-4 Turbo with Vision を使った Vision の機能強化は、Azure OpenAI Playground で利用できるようになりました。また、光学式文字認識、オブジェクト グラウンディング、"データの追加" の画像サポート、ビデオ プロンプトのサポートが含まれています。
  • REST API を使用してチャット API を直接呼び出します。
  • 現在、利用可能なリージョンはSwitzerlandNorthSwedenCentralWestUS、およびAustraliaEast に制限されています
  • GPT-4 Turbo with Vision の既知の制限事項と、その他のよく寄せられる質問の詳細をご覧ください。

2023 年 11 月

Azure OpenAI On Your Data での新しいデータ ソース サポート

  • Azure Cosmos DB for MongoDB 仮想コアおよび URL/Web アドレスをデータ ソースとして使用して、データを取り込み、サポートされている Azure OpenAI モデルとチャットできるようになりました。

GPT-4 Turbo プレビューと GPT-3.5-Turbo-1106 のリリース

両モデルとも OpenAI の最新リリースであり、指示実行、JSON モード再現可能な出力、並列関数呼び出しが改善されています。

  • GPT-4 Turbo プレビューには、最大 128,000 トークンのコンテキスト ウィンドウがあり、4,096 の出力トークンを生成できます。 その最新のトレーニング データには 2023 年 4 月までの情報が含まれています。 このモデルはプレビュー段階であるため、運用環境では使用しないことをお勧めします。 このプレビュー モデルのデプロイはすべて、安定版リリースが利用可能になると自動的にインプレースで更新されます。

  • GPT-3.5 Turbo 1106 には、最大 16,385 トークンのコンテキスト ウィンドウがあり、4,096 の出力トークンを生成できます。

リージョン別のモデルの提供状況については、モデルのページを参照してください。

モデルには、リージョンごとに独自の一意のクォータ割り当てがあります。

DALL-E 3 パブリック プレビュー

DALL-E 3 は、OpenAI の最新の画像生成モデルです。 画像の品質が向上し、より複雑なシーンが表示され、画像内のテキストをレンダリングするときのパフォーマンスが向上しています。 また、縦横比のオプションが増えています。 DALL-E 3 は、OpenAI Studio と REST API を通じて使用できます。 OpenAI リソースは、SwedenCentral Azure リージョンに存在する必要があります。

DALL-E 3 には、画像を強化し、バイアスを減らし、自然な変動を増やすためのプロンプト書き換えが組み込まれています。

クイックスタートに従って、DALL-E 3 をお試しください。

責任ある AI

  • 拡張された顧客の構成可能性: Azure OpenAI のすべてのお客様は、ヘイト、暴力、性的、自傷のカテゴリに対して、すべての重大度レベル (低、中、高) を構成できるようになりました。これには重大度の高いコンテンツのみをフィルター処理することが含まれます。 コンテンツ フィルターを構成する

  • すべての DALL-E モデルのコンテンツ資格情報: すべての DALL-E モデルから生成された AI 画像には、AI が生成したコンテンツであることを示すデジタル資格情報が含まれるようになりました。 画像アセットを表示するアプリケーションでは、AI で生成された画像に資格情報を表示するために、オープンソースの Content Authenticity Initiative SDK が利用されています。 Azure OpenAI のコンテンツ資格情報

  • 新しい RAI モデル

    • 脱獄リスク検出: 脱獄攻撃は、システム メッセージに設定されたルールを回避または中断するようにトレーニングされた動作を生成 AI モデルに示させる目的で設計されたユーザー プロンプトです。 脱獄リスク検出モデルは省略可能 (既定ではオフ) で、注釈とフィルター モデルで使用できます。 これはユーザー プロンプトで実行されます。
    • 保護済み素材テキスト: 保護済み素材テキストは、大規模言語モデルによって出力される可能性のある既知のテキスト コンテンツ (曲の歌詞、記事、レシピ、一部の Web コンテンツなど) を記述するものです。 保護済み素材テキスト モデルは省略可能 (既定ではオフ) で、注釈とフィルター モデルで使用できます。 これは LLM の完了時に実行されます。
    • 保護済み素材コード: 保護済み素材コードは、ソース リポジトリを適切に引用することなく大規模言語モデルによって出力される可能性のある、パブリック リポジトリからの一連のソース コードと一致するソース コードを記述するものです。 保護済み素材コード モデルは省略可能 (既定ではオフ) で、注釈とフィルター モデルで使用できます。 これは LLM の完了時に実行されます。

    コンテンツ フィルターを構成する

  • ブロックリスト: お客様は、自分のフィルターにカスタム ブロックリストを作成して、プロンプトと入力候補のコンテンツ フィルターの動作をすばやくカスタマイズできるようになりました。 カスタム ブロックリストを使用すると、そのフィルターでパターンのカスタマイズされたリスト (特定の用語や正規表現パターンなど) に対してアクションを実行できます。 カスタム ブロックリストに加えて、Microsoft の不適切な表現のブロックリスト (英語) も提供しています。 ブロックリストを使用する

2023 年 10 月

新しい微調整モデル (プレビュー)

Azure OpenAI On Your Data

  • 取得したドキュメントの数と厳密度を決定する、新しいカスタム パラメーター
    • 厳密度の設定では、クエリに関連するドキュメントの分類に使用するしきい値を設定します。
    • 取得したドキュメントの設定では、応答の生成に使用されるデータ インデックスの上位スコアのドキュメントの数を指定します。
  • Azure OpenAI Studio でデータ インジェスト/アップロードの状態を確認できます。
  • BLOB コンテナーでのプライベート エンドポイントと VPN のサポート。

2023 年 9 月

GPT-4

GPT-4 と GPT-4-32k は、すべての Azure OpenAI Service のお客様が利用できるようになりました。 お客様は、GPT-4 と GPT-4-32k を使用するための待機リストに申し込む必要がなくなりました (制限付きアクセス登録要件はすべての Azure OpenAI モデルに引き続き適用されます)。 提供状況はリージョンによって異なる場合があります。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

GPT-3.5 Turbo Instruct

Azure OpenAI Service で GPT-3.5 Turbo Instruct モデルがサポートされるようになりました。 このモデルのパフォーマンスは text-davinci-003 と同等であり、Completions API で使用できます。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

Whisper パブリック プレビュー

Azure OpenAI Service は、OpenAI の Whisper モデルによる音声テキスト変換 API をサポートするようになりました。 指定した音声に基づいて AI で生成されたテキストを取得します。 詳細については、クイックスタートを参照してください。

Note

Azure AI 音声は、バッチ文字起こし API を介した OpenAI の Whisper モデルもサポートしています。 詳細については、「バッチ文字起こしを作成する」ガイドを参照してください。 Azure AI 音声と Azure OpenAI Service の使い分けの詳細については、「Whisper モデルとは」を参照してください。

新しいリージョン

  • Azure OpenAI は、スウェーデン中部およびスイス北部リージョンでも使用できるようになりました。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

リージョンのクォータ制限の引き上げ

  • 特定のモデルとリージョンについて、既定のクォータ制限の最大値に引き上げられます。 これらのモデルとリージョンにワークロードを移行すると、より大きい 1 分あたりのトークン数 (TPM) を利用できます。

2023 年 8 月

独自のデータに基づく Azure OpenAI (プレビュー) の更新

2023 年 7 月

関数呼び出しのサポート

入力配列の増加の埋め込み

新しいリージョン

  • Azure OpenAI は、カナダ東部、米国東部 2、東日本、米国中北部リージョンでも使用できるようになりました。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

2023 年 6 月

独自のデータに基づく Azure OpenAI を使用する (プレビュー)

  • Azure OpenAI On Your Data がプレビューでお使いいただけるようになりました。これにより、GPT-35-Turbo や GPT-4 などの OpenAI モデルとチャットし、データに基づいて応答を受信できます。

gpt-35-turbo および gpt-4 モデルの新しいバージョン

  • gpt-35-turbo (バージョン 0613)
  • gpt-35-turbo-16k (バージョン 0613)
  • gpt-4 (バージョン 0613)
  • gpt-4-32k (バージョン 0613)

英国南部

  • Azure OpenAI が米国南部リージョンで使用できるようになりました。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

コンテンツのフィルターと注釈 (プレビュー)

Quota

2023 年 5 月

Java と JavaScript SDK のサポート

  • JavaScriptJava のサポートを提供する新しい Azure OpenAI プレビュー SDK。

Azure OpenAI Chat Completion の一般提供 (GA)

  • 一般提供サポート:
    • Chat Completion API バージョン 2023-05-15
    • GPT-35-Turbo モデル。
    • GPT-4 モデル シリーズ。

現在 2023-03-15-preview API を使用している場合は、GA 2023-05-15 API に移行することをお勧めします。 現在 API バージョン 2022-12-01 を使用している場合、この API は GA のままですが、最新の Chat Completion 機能は含まれません。

重要

補完エンドポイントでの GPT-35-Turbo モデルの現在のバージョンの使用は、プレビュー段階のままです。

フランス中部

  • Azure OpenAI がフランス中部リージョンで使用できるようになりました。 各リージョンでのモデル提供状況の最新情報は、モデル のページをご確認ください。

2023 年 4 月

  • DALL-E 2 パブリック プレビュー。 Azure OpenAI Service では、OpenAI の DALL-E 2 モデルを利用したイメージ生成 API がサポートされるようになりました。 指定した説明テキストに基づいて、AI によって生成されたイメージを取得します。 詳細については、クイックスタートを参照してください。 アクセスをリクエストする場合、既存の Azure OpenAI のお客様は、このフォームに入力することで申請できます。

  • カスタマイズされたモデルの非アクティブなデプロイは、15 日後に削除されます。モデルは引き続き再デプロイに使用できます。 カスタマイズされた (微調整された) モデルが 15 日間を超えてデプロイされ、候補呼び出しやチャット候補呼び出しが行われなかった場合、デプロイは自動的に削除されます (そのデプロイに対するホスティング料金は発生しません)。 基になるカスタマイズされたモデルは引き続き使用でき、いつでも再デプロイできます。 詳しくは、操作方法に関する記事をご覧ください。

2023 年 3 月

  • GPT-4 シリーズ モデルは、Azure OpenAI でプレビューで利用できるようになりました。 アクセスをリクエストする場合、既存の Azure OpenAI のお客様は、このフォームに入力することで申請できます。 これらのモデルは現在、米国東部と米国中南部のリージョンで使用できます。

  • 3 月 21 日にプレビューでリリースされた、GPT-35-Turbo および GPT-4 モデル用の新しいチャット補完 API。 詳細については、更新されたクイックスタート操作方法に関する記事を参照してください。

  • GPT-35-Turbo プレビュー。 詳細については、操作方法に関する記事を確認してください。

  • 微調整のためにトレーニング制限を増加: トレーニング ジョブの最大サイズ (トレーニング ファイル内のトークン) x (エポック数) は、すべてのモデルに対して 20 億トークンになりました。 また、最大トレーニング ジョブを 120 時間から 720 時間に増やしました。

  • 既存のアクセス権へのユース ケースの追加。  以前は、新しいユース ケースを追加するプロセスで、お客様がサービスに再適用する必要がありました。 現在、サービスの使用に新しいユース ケースを迅速に追加できる、新しいプロセスをリリースしています。 このプロセスは、Azure AI サービス内で確立されている制限付きアクセス プロセスに従っています。 既存のお客様は、こちらからすべての新しいユース ケースを証明できます。 これは、最初に申請しなかった新しいユース ケースでサービスを使用するときに必ず必要になるので注意してください。

2023 年 2 月

新機能

更新プログラム

  • コンテンツのフィルター処理が既定でオンになっています。

次に関する新しい記事:

新しいトレーニング コース:

2023 年 1 月

新機能

  • サービス GA。 Azure OpenAI Service が一般提供になりました。

  • 新しいモデル: 最新のテキスト モデル text-davinci-003 (米国東部、西ヨーロッパ)、text-ada-embeddings-002 (米国東部、米国中南部、西ヨーロッパ) の追加

2022 年 12 月

新機能

  • OpenAI の最新モデル。 Azure OpenAI を使うと、GPT-3.5 シリーズを含むすべての最新モデルにアクセスできます。

  • 新しい API バージョン (2022-12-01)。 この更新プログラムには、リクエストをいただいていた機能強化がいくつか含まれています。たとえば、API 応答でのトークン使用情報、ファイルのエラー メッセージの改善、作成データ構造の微調整に関する OpenAI との整合、微調整されたジョブのカスタム名前付けを可能にする suffix パラメーターのサポートなどです。 ​

  • 1 秒あたりの要求数の上限を引き上げました。 非 Davinci モデルの場合は 50。 Davinci モデルの場合は 20。

  • デプロイの微調整を高速化しました。 Ada と Curie の微調整されたモデルを 10 分未満でデプロイできます。

  • トレーニング上限を引き上げました: Ada、Babbage、Curie の場合は 40M トレーニング トークン。 Davinci の場合は 10M。

  • データ ログと人間によるレビューの不正使用と誤用に対する変更要求のプロセス。 現在、このサービスでは、これらの強力なモデルが不正使用されないように、不正使用と誤用を検出する目的で要求と応答のデータをログしています。 ただし、多くのお客様はデータのプライバシーとセキュリティの要件が厳格なので、データをより細かく管理する必要があります。 このようなユース ケースをサポートするために、お客様がコンテンツ フィルター処理ポリシーを変更することや、低リスクのユース ケースで不正使用ログをオフにすることができる新しいプロセスをリリースしています。 このプロセスは、Azure AI サービス 内で確立されている制限付きアクセス プロセスに従っているため、既存の OpenAI のお客様はこちらからお申し込みいただけます

  • カスタマー マネージド キー (CMK) の暗号化。 CMK にはトレーニング データとカスタマイズされたモデルの格納に使われる独自の暗号化キーがあるので、お客様は Azure OpenAI のデータ管理をより細かく制御できます。 カスタマー マネージド キー (CMK、Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます。 また、データを保護するために使われる暗号化キーを監査することもできます。 詳細については、保存時の暗号化ドキュメントを参照してください

  • ロックボックスのサポート

  • SOC-2 への準拠

  • Azure Resource Health、コスト分析、メトリックと診断の設定を使ったログと診断

  • Studio の機能強化。 微調整されたモデルの作成とデプロイにチーム内の誰がアクセスできるかを制御するための Azure AD ロール サポートを含め、Studio ワークフローのさまざまな点を使いやすくしました。

変更 (破壊的)

微調整: OpenAI のスキーマに合わせて、作成 API 要求が更新されました。

プレビュー API のバージョン:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API バージョン 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

既定でコンテンツのフィルター処理は一時的にオフです。 Azure コンテンツ モデレーションは、Azure OpenAI とは異なる方法で動作します。 Azure OpenAI を使うと、生成呼び出し時にコンテンツ フィルターを実行し、有害な、または不正使用のコンテンツとフィルターを検出し、応答から除外することができます。 詳細情報​

これらのモデルは 2023 年第 1 四半期に再び有効になり、既定でオンになります。 ​

お客様のアクション

次の手順

Azure OpenAI をサポートする基となるモデルに関する記事を確認します。