Azure OpenAI Service の新機能

[アーティクル]
06/19/2024

この記事では、Azure OpenAI の最新リリースと主要なドキュメント更新の概要を示します。

2024 年 6 月

提供終了日の更新

gpt-35-turbo 0301 の提供終了日を、2024 年 10 月 1 日以降に更新しました。
gpt-35-turbo と gpt-35-turbo-16k 0613 の提供終了日を、2024 年 10 月 1 日に更新しました。
gpt-4 と gpt-4-32k 0314 の非推奨となる日を 2024 年 10 月 1 日に、提供終了日を 2025 年 6 月 6 日に更新しました。

モデルの非推奨と提供終了に関する最新情報については、「モデル提供終了ガイド」を参照してください。

微調整のためのトークンベース課金

Azure OpenAI の微調整課金は、トレーニングの総経過時間ではなく、トレーニングファイルのトークンの数に基づくようになりました。これにより、一部のトレーニング実行のコストが大幅に削減され、微調整コストの見積もりがはるかに簡単になります。詳細については、公式発表を参照してください。

新しいリージョンで GPT-4o がリリースされました

GPT-4o は、次のリージョンでも使用できるようになりました。
- 標準のリージョンデプロイ用のスウェーデン中部。
- プロビジョニングされたデプロイ用のオーストラリア東部、カナダ東部、東日本、韓国中部、スウェーデン中部、スイス北部、および米国西部 3。

モデルの提供状況に関する最新情報については、モデルのページを参照してください。

Assistants 用のカスタマーマネージドキー (CMK) のサポート

Assistants のスレッドとファイルで、次のリージョンの CMK がサポートされるようになりました。

米国西部 3

2024 年 5 月

GPT-4o プロビジョニング済みデプロイ

gpt-4o バージョン: 2024-05-13 は、標準デプロイとプロビジョニングされたデプロイの両方で使用できます。プロビジョニング済みと標準のモデルデプロイでは、テキストと画像/ビジョンの両方の推論要求を受け入れます。リージョン別のモデルの提供状況については、プロビジョニングされたデプロイのモデルマトリックスを参照してください。

Assistants v2 (プレビュー)

Assistants API の更新が一般公開されました。次の更新が含まれています。

ファイル検索ツールとベクトルストレージ
トークン使用の管理のために最大完了トークンと最大プロンプトトークンをサポート。
指定したツールを使用するようアシスタントに強制する tool_choice パラメーター。アシスタントロールでメッセージを作成して、スレッドのカスタム会話履歴を作成できるようになりました。
temperature、top_p、response_format のパラメーターのサポート。
ストリーミングとポーリングのサポート。 Python SDK のヘルパー関数を使用して、実行とストリーム応答を作成できます。ポーリング不要でオブジェクトの状態の更新を共有できるポーリング SDK ヘルパーも追加されました。
Azure OpenAI Studio を使用した Logic Apps と関数呼び出しの実験。 Logic Apps に実装されている REST API を関数としてインポートすると、Studio はユーザープロンプトに基づいて、関数を (Logic Apps ワークフローとして) 自動的に呼び出します。
AutoGen by Microsoft Research では、幅広いアプリケーションで大規模言語モデル (LLM) ワークフローを手軽に構築できるマルチエージェント会話フレームワークが提供されます。 Azure OpenAI アシスタントは、アシスタントを AutoGen ベースのマルチエージェントワークフローにシームレスに追加できる、新しい実験的なエージェントである GPTAssistantAgent を介して AutoGen に統合されました。これにより、タスクやドメインに特化した複数の Azure OpenAI アシスタントを協働させて、複雑なタスクに取り組めます。
微調整された gpt-3.5-turbo-0125 モデルが次のリージョンでサポートされます。
- 米国東部 2
- スウェーデン中部
次のリージョンでリージョンサポートが展開されました。
- 東日本
- 英国南部
- 米国西部
- 米国西部 3
- ノルウェー東部

詳細については、アシスタントに関するブログ記事を参照してください。

GPT-4o モデルの一般提供 (GA)

GPT-4o ("o" は "オムニ" の意) は、2024 年 5 月 13 日に発表された OpenAI の最新モデルです。

GPT-4o はテキストと画像を 1 つのモデルに統合し、複数のデータ型を同時に処理できるようにします。このマルチモーダルアプローチにより、人間とコンピューターの対話における精度と応答性が向上します。
GPT-4o は、英語以外の言語とビジョンタスクで優れたパフォーマンスを提供しながら、英語のテキストとコーディングタスクにおいて GPT-4 Turbo に匹敵し、AI 機能の新しいベンチマークを設定します。

リージョン別のモデルの提供状況については、モデルのページを参照してください。

グローバル標準の展開の種類 (プレビュー)

グローバル展開は、非グローバルオファーと同じ Azure OpenAI リソースで利用できます。ただし、Azure のグローバルインフラストラクチャを利用して、トラフィックを要求ごとに最適な可用性のデータセンターに動的にルーティングできます。グローバル標準では、新しいモデルに対して最大の既定クォータが提供され、複数のリソース間での負荷分散の必要がなくなります。

詳細については、「展開の種類ガイド」を参照してください。

微調整に関する更新

現在、GPT-4 の微調整はパブリックプレビューで利用できます。
2024-05-01-preview API リリースの一環として、シード、イベント、完全な検証統計、チェックポイントのサポートが追加されました。

DALL-E および GPT-4 Turbo Vision GA の構成可能なコンテンツフィルター

DALL-E 2 および 3、GPT-4 Turbo with Vision GA (gpt-4-turbo-2024-04-09)、GPT-4o のデプロイ用のカスタムコンテンツフィルターを作成できます。コンテンツのフィルター処理

すべての Azure OpenAI カスタマーが利用できる非同期フィルター

ストリーミングシナリオでの待機時間を改善するための、フィルターの非同期的な実行を、すべての Azure OpenAI カスタマーが利用できるようになりました。コンテンツのフィルター処理

プロンプトシールド

プロンプトシールドは、Azure OpenAI モデルを利用するアプリケーションを、直接攻撃 (ジェイルブレイク) と間接攻撃の 2 種類の攻撃から保護します。間接攻撃 (間接プロンプト攻撃またはクロスドメインプロンプトインジェクション攻撃とも呼ばれます) は、生成 AI モデルを搭載したシステムに対する攻撃の一種で、アプリケーション開発者やユーザーが直接作成していない情報をアプリケーションが処理するときに発生する可能性があります。コンテンツのフィルター処理

2024-05-01-preview API リリース

詳細については、「API バージョンライフサイクル」を参照してください。

GPT-4 Turbo モデルの一般提供 (GA)

GPT-4 Turbo の最新 GA リリースは次のとおりです。

gpt-4バージョン:turbo-2024-04-09

これは、次のプレビューモデルに代わるものです。

gpt-4バージョン:1106-Preview
gpt-4バージョン:0125-Preview
gpt-4バージョン:vision-preview

OpenAI と Azure OpenAI GPT-4 Turbo GA モデルの違い

OpenAI の最新の 0409 ターボモデルバージョンでは、すべての推論要求に対して JSON モードと関数呼び出しがサポートされています。
Azure OpenAI の最新の turbo-2024-04-09 バージョンでは、現在、画像 (ビジョン) 入力による推論要求を行う場合、JSON モードと関数呼び出しの使用はサポートされていません。テキストベース入力の要求 (image_url とインラインイメージがない要求) では、JSON モードと関数呼び出しがサポートされています。

gpt-4 vision-preview との違い

Azure AI 固有の Vision 拡張機能と GPT-4 Turbo with Vision の統合は、gpt-4 バージョン:turbo-2024-04-09 ではサポートされていません。これには、光学式文字認識 (OCR)、オブジェクトグラウンディング、ビデオプロンプト、画像を含むデータの処理の改善が含まれます。

GPT-4 Turbo のプロビジョニングされたマネージド可用性

gpt-4バージョン:turbo-2024-04-09 は、標準デプロイとプロビジョニングされたデプロイの両方で使用できます。現在、このモデルのプロビジョニングされたバージョンでは、イメージ/ビジョン推論要求はサポートされていません。このモデルのプロビジョニングされたデプロイでは、テキスト入力のみ受け入れます。標準のモデルデプロイでは、テキストと画像/ビジョンの両方の推論要求を受け入れます。

利用可能なリージョン

リージョン別のモデルの提供状況については、標準とプロビジョニングされたデプロイのモデルマトリックスを参照してください。

GPT-4 Turbo with Vision GA のデプロイ

Studio UI から GA モデルをデプロイするには、GPT-4 を選択し、ドロップダウンメニューから turbo-2024-04-09 バージョンを選択します。 gpt-4-turbo-2024-04-09 モデルの既定のクォータは、GPT-4-Turbo の現在のクォータと同じになります。リージョンのクォータ制限を参照してください。

2024 年 4 月

米国東部 2 とスイス西部という 2 つの新しいリージョンで微調整がサポートされるようになりました

次の機能をサポートする微調整が利用できるようになりました。

米国東部 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

スイス西部

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

各リージョンでのモデルの提供状況とファインチューニングのサポートに関する最新情報は、モデルのページをご確認ください。

マルチターンチャットトレーニング例

微調整でマルチターンチャットトレーニング例がサポートされるようになりました。

GPT-4 (0125) は Azure OpenAI On Your Data で使用できます

Azure OpenAI on Your Data を使用して対応リージョンで GPT-4 (0125) モデルを使用できるようになりました。

2024 年 3 月

Azure OpenAI Studio でのリスクと安全性の監視

Azure OpenAI Studio では、コンテンツフィルター構成を使用するデプロイごとにリスクと安全性のダッシュボードが提供されるようになりました。これを使用して、フィルター処理アクティビティの結果を確認します。その後、フィルター構成を調整して、より適切にビジネスニーズに対応し、責任ある AI 原則を満たすことができます。

リスクと安全性の監視の使用

Azure OpenAI On Your Data の更新

Azure OpenAI On Your Data で使用する Elasticsearch ベクトルデータベースに接続できるようになりました。
データインジェスト中にチャンクサイズパラメーターを使用して、インデックス内の特定のデータチャンクのトークンの最大数を設定できます。

2024-02-01 一般提供 (GA) API がリリースされました

これは最新の GA API リリースであり、以前の 2023-05-15 GA API リリースに代わるものです。このリリースには、データなどに対する Whisper、DALL-3、微調整などの最新の Azure OpenAI GA 機能のサポートが含まれています。

アシスタント、テキスト読み上げ (TTS)、データデータソース上の特定の機能など、まだプレビュー段階にある機能は、引き続きプレビュー API バージョンが必要です。詳細については、API バージョンのライフサイクルガイドを参照してください。

Whisper 一般提供 (GA)

Whisper 音声テキスト変換モデルは、REST と Python の両方で GA になりました。クライアントライブラリ SDK は現在、パブリックプレビュー段階にあります。

クイックスタートに従って、Whisper をお試しください。

DALL-E 3 一般提供 (GA)

DALL-E 3 画像生成モデルは、REST と Python の両方で GA になりました。クライアントライブラリ SDK は現在、パブリックプレビュー段階にあります。

クイックスタートに従って、DALL-E 3 をお試しください。

DALL-E 3 の新しいリージョンサポート

SwedenCentral に加え、East US と AustraliaEast の Azure リージョンでも、Azure OpenAI リソースで DALL-E 3 にアクセスできるようになりました。

モデルの非推奨と提供終了

Azure OpenAI Service でのモデルの非推奨と提供終了を追跡するページが追加されました。このページでは、現在使用可能、非推奨、提供終了のモデルに関する情報を提供します。

2024-03-01-preview API がリリースされました

2024-03-01-preview は、 2024-02-15-preview と同じ機能をすべて備えており、埋め込み用の以下の 2 つの新しいパラメータが追加されています。

encoding_format では、埋め込みを生成する形式を float または base64 で指定できます。既定値は、float です。
dimensions では、出力される埋め込みの数を設定できます。このパラメータは、新しい第 3 世代埋め込みモデル (text-embedding-3-large および text-embedding-3-small) でのみサポートされています。通常、埋め込みが大きくなると、コンピューティング、メモリ、ストレージの観点からコストが高くなります。ディメンション数を調整できるので、全体的なコストとパフォーマンスをより詳細に制御できます。 dimensions パラメーターは OpenAI 1.x Python ライブラリのすべてのバージョンでサポートされているわけではありません。このパラメーターを利用するには、最新バージョンの pip install openai --upgrade にアップグレードすることをお勧めします。

現在、プレビュー API バージョンを使用して最新の機能を利用している場合は、API バージョンのライフサイクルに関する記事を参照して、現在お使いの API バージョンのサポート期間を確認することをお勧めします。

GPT-4-1106-Preview アップグレードプランの更新

2024 年 3 月 8 日に予定されていた gpt-4 1106-Preview から gpt-4 0125-Preview へのデプロイアップグレードは行われなくなりました。 "自動更新を既定にする" と "期限切れになったときにアップグレードする" に設定された gpt-4 バージョン 1106-Preview と 0125-Preview のデプロイは、安定バージョンのモデルがリリースされた後にアップグレードが開始されます。

アップグレードプロセスの詳細については、モデルに関するページを参照してください。

2024 年 2 月

GPT-3.5-turbo-0125 モデルが利用可能になりました

このモデルではさまざまな機能強化が組み込まれました。たとえば、要求された形式での応答精度の向上、英語以外の言語の関数呼び出しに対してテキストエンコードの問題が発生していたバグの修正などです。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

利用可能な第 3 世代埋め込みモデル

text-embedding-3-large
text-embedding-3-small

OpenAI の報告によると、テストでは、大規模と小規模の第 3 世代埋め込みモデルのいずれも、MIRACL ベンチマークで多言語検索の平均パフォーマンスが向上しており、さらに MTEB ベンチマークで、第 2 世代の text-embedding-ada-002 モデルよりも優れた英語タスクのパフォーマンスを維持しています。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

GPT-3.5 Turbo のクォータ統合

異なるバージョンの GPT-3.5-Turbo モデル (16k を含む) 間の移行を簡略化するために、すべての GPT-3.5-Turbo クォータを 1 つのクォータ値に統合します。

クォータの引き上げが承認されたお客様は、以前の引き上げを反映した統合された合計クォータを保有します。
モデルバージョン全体の現在の合計使用量が既定値より少ないお客様は、統合された新しい合計クォータを既定で取得します。

GPT-4-0125-preview モデルが利用可能

gpt-4 モデルのバージョン 0125-preview が、米国東部、米国中北部、米国中南部の各リージョンの Azure OpenAI Service で利用できるようになりました。 gpt-4 バージョン 1106-previewのデプロイを使用しているお客様は、今後数週間以内に 0125-preview に自動的にアップグレードされます。

リージョン別のモデルの提供状況とアップグレードについては、モデルのページを参照してください。

Assistants API パブリックプレビュー

Azure OpenAI では、OpenAI の GPT を利用できる API がサポートされるようになりました。 Azure OpenAI Assistants (プレビュー) を使用すると、カスタム命令やコードインタープリターなどの高度なツール、およびカスタム関数を使用して、自分のニーズに合わせて調整された AI アシスタントを作成できます。詳細については、以下をご覧ください。

OpenAI テキスト読み上げ音声パブリックプレビュー

Azure OpenAI Service では、OpenAI の音声を使用したテキスト読み上げ API がサポートされるようになりました。指定したテキストから AI で生成された音声を取得します。詳細については、「概要ガイド」を参照し、「クイックスタート」を試してください。

Note

Azure AI 音声でも、OpenAI のテキスト読み上げ音声がサポートされています。詳細については、「Azure OpenAI Service または Azure AI 音声を介した OpenAI テキスト読み上げ音声」ガイドを参照してください。

新しいファインチューニング機能とモデルのサポート

独自のデータに基づく Azure OpenAI の新しいリージョンサポート

これで、次の Azure リージョンで Azure OpenAI On Your Data を使用できるようになりました。

南アフリカ北部

Azure OpenAI On Your Data の一般提供

Azure OpenAI On Your Data が一般公開されました。

2023 年 12 月

Azure OpenAI On Your Data

ストレージアカウント、Azure OpenAI リソース、Azure AI 検索サービスリソースのセキュリティサポートなど、Azure OpenAI On Your Data に対する VPN とプライベートエンドポイントの完全なサポート。
仮想ネットワークとプライベートエンドポイントを使用してデータを保護することで、Azure OpenAI On Your Data を安全に使用するための新しい記事。

GPT-4 Turbo with Vision が利用可能

Azure OpenAI サービスの GPT-4 Turbo with Vision はパブリックプレビュー中です。 GPT-4 Turbo with Vision は、OpenAI によって開発された大規模なマルチモーダルモデル (LMM) であり、画像を分析し、それらに関する質問に対してテキストでの応答を提供できます。自然言語処理とビジュアル解釈の両方が組み込まれています。拡張モードでは、Azure AI Vision 機能を使用して、画像から追加の分析情報を生成できます。

Azure OpenAI Playground を使用して、ノーコードエクスペリエンスで GPT-4 Turbo with Vision の機能を探索します。詳細については、クイックスタートガイドを参照してください。
GPT-4 Turbo with Vision を使った Vision の機能強化は、Azure OpenAI Playground で利用できるようになりました。また、光学式文字認識、オブジェクトグラウンディング、"データの追加" の画像サポート、ビデオプロンプトのサポートが含まれています。
REST API を使用してチャット API を直接呼び出します。
現在、利用可能なリージョンはSwitzerlandNorth、SwedenCentral、WestUS、およびAustraliaEast に制限されています
GPT-4 Turbo with Vision の既知の制限事項と、その他のよく寄せられる質問の詳細をご覧ください。

2023 年 11 月

Azure OpenAI On Your Data での新しいデータソースサポート

Azure Cosmos DB for MongoDB 仮想コアおよび URL/Web アドレスをデータソースとして使用して、データを取り込み、サポートされている Azure OpenAI モデルとチャットできるようになりました。

GPT-4 Turbo プレビューと GPT-3.5-Turbo-1106 のリリース

両モデルとも OpenAI の最新リリースであり、指示実行、JSON モード、再現可能な出力、並列関数呼び出しが改善されています。

GPT-4 Turbo プレビューには、最大 128,000 トークンのコンテキストウィンドウがあり、4,096 の出力トークンを生成できます。その最新のトレーニングデータには 2023 年 4 月までの情報が含まれています。このモデルはプレビュー段階であるため、運用環境では使用しないことをお勧めします。このプレビューモデルのデプロイはすべて、安定版リリースが利用可能になると自動的にインプレースで更新されます。
GPT-3.5 Turbo 1106 には、最大 16,385 トークンのコンテキストウィンドウがあり、4,096 の出力トークンを生成できます。

リージョン別のモデルの提供状況については、モデルのページを参照してください。

モデルには、リージョンごとに独自の一意のクォータ割り当てがあります。

DALL-E 3 パブリックプレビュー

DALL-E 3 は、OpenAI の最新の画像生成モデルです。画像の品質が向上し、より複雑なシーンが表示され、画像内のテキストをレンダリングするときのパフォーマンスが向上しています。また、縦横比のオプションが増えています。 DALL-E 3 は、OpenAI Studio と REST API を通じて使用できます。 OpenAI リソースは、SwedenCentral Azure リージョンに存在する必要があります。

DALL-E 3 には、画像を強化し、バイアスを減らし、自然な変動を増やすためのプロンプト書き換えが組み込まれています。

クイックスタートに従って、DALL-E 3 をお試しください。

責任ある AI

拡張された顧客の構成可能性: Azure OpenAI のすべてのお客様は、ヘイト、暴力、性的、自傷のカテゴリに対して、すべての重大度レベル (低、中、高) を構成できるようになりました。これには重大度の高いコンテンツのみをフィルター処理することが含まれます。コンテンツフィルターを構成する
すべての DALL-E モデルのコンテンツ資格情報: すべての DALL-E モデルから生成された AI 画像には、AI が生成したコンテンツであることを示すデジタル資格情報が含まれるようになりました。画像アセットを表示するアプリケーションでは、AI で生成された画像に資格情報を表示するために、オープンソースの Content Authenticity Initiative SDK が利用されています。 Azure OpenAI のコンテンツ資格情報
新しい RAI モデル
- 脱獄リスク検出: 脱獄攻撃は、システムメッセージに設定されたルールを回避または中断するようにトレーニングされた動作を生成 AI モデルに示させる目的で設計されたユーザープロンプトです。脱獄リスク検出モデルは省略可能 (既定ではオフ) で、注釈とフィルターモデルで使用できます。これはユーザープロンプトで実行されます。
- 保護済み素材テキスト: 保護済み素材テキストは、大規模言語モデルによって出力される可能性のある既知のテキストコンテンツ (曲の歌詞、記事、レシピ、一部の Web コンテンツなど) を記述するものです。保護済み素材テキストモデルは省略可能 (既定ではオフ) で、注釈とフィルターモデルで使用できます。これは LLM の完了時に実行されます。
- 保護済み素材コード: 保護済み素材コードは、ソースリポジトリを適切に引用することなく大規模言語モデルによって出力される可能性のある、パブリックリポジトリからの一連のソースコードと一致するソースコードを記述するものです。保護済み素材コードモデルは省略可能 (既定ではオフ) で、注釈とフィルターモデルで使用できます。これは LLM の完了時に実行されます。
コンテンツフィルターを構成する
ブロックリスト: お客様は、自分のフィルターにカスタムブロックリストを作成して、プロンプトと入力候補のコンテンツフィルターの動作をすばやくカスタマイズできるようになりました。カスタムブロックリストを使用すると、そのフィルターでパターンのカスタマイズされたリスト (特定の用語や正規表現パターンなど) に対してアクションを実行できます。カスタムブロックリストに加えて、Microsoft の不適切な表現のブロックリスト (英語) も提供しています。ブロックリストを使用する

2023 年 10 月

新しい微調整モデル (プレビュー)

gpt-35-turbo-0613 が、微調整に使用できるようになりました。
babbage-002 と davinci-002 が、微調整に使用できるようになりました。これらのモデルは、以前微調整に使用できたレガシ ada、babbage、curie、davinci ベースモデルに代わるものです。
微調整は、特定のリージョンでのみ利用できます。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。
微調整されたモデルには、通常のモデルとは異なるクォータ制限があります。
チュートリアル: GPT-3.5-Turbo の微調整

Azure OpenAI On Your Data

取得したドキュメントの数と厳密度を決定する、新しいカスタムパラメーター。
- 厳密度の設定では、クエリに関連するドキュメントの分類に使用するしきい値を設定します。
- 取得したドキュメントの設定では、応答の生成に使用されるデータインデックスの上位スコアのドキュメントの数を指定します。
Azure OpenAI Studio でデータインジェスト/アップロードの状態を確認できます。
BLOB コンテナーでのプライベートエンドポイントと VPN のサポート。

2023 年 9 月

GPT-4

GPT-4 と GPT-4-32k は、すべての Azure OpenAI Service のお客様が利用できるようになりました。お客様は、GPT-4 と GPT-4-32k を使用するための待機リストに申し込む必要がなくなりました (制限付きアクセス登録要件はすべての Azure OpenAI モデルに引き続き適用されます)。提供状況はリージョンによって異なる場合があります。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

GPT-3.5 Turbo Instruct

Azure OpenAI Service で GPT-3.5 Turbo Instruct モデルがサポートされるようになりました。このモデルのパフォーマンスは text-davinci-003 と同等であり、Completions API で使用できます。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

Whisper パブリックプレビュー

Azure OpenAI Service は、OpenAI の Whisper モデルによる音声テキスト変換 API をサポートするようになりました。指定した音声に基づいて AI で生成されたテキストを取得します。詳細については、クイックスタートを参照してください。

Note

Azure AI 音声は、バッチ文字起こし API を介した OpenAI の Whisper モデルもサポートしています。詳細については、「バッチ文字起こしを作成する」ガイドを参照してください。 Azure AI 音声と Azure OpenAI Service の使い分けの詳細については、「Whisper モデルとは」を参照してください。

新しいリージョン

Azure OpenAI は、スウェーデン中部およびスイス北部リージョンでも使用できるようになりました。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

リージョンのクォータ制限の引き上げ

特定のモデルとリージョンについて、既定のクォータ制限の最大値に引き上げられます。これらのモデルとリージョンにワークロードを移行すると、より大きい 1 分あたりのトークン数 (TPM) を利用できます。

2023 年 8 月

独自のデータに基づく Azure OpenAI (プレビュー) の更新

Azure OpenAI On Your Data を Power Virtual Agents にデプロイできるようになりました。
Azure OpenAI On Your Data でプライベートエンドポイントがサポートされるようになりました。
機密ドキュメントへのアクセス権をフィルター処理する機能。
スケジュールに従ってインデックスを自動的に更新。
ベクトル検索とセマンティック検索のオプション。
デプロイされた Web アプリでチャット履歴を表示

2023 年 7 月

関数呼び出しのサポート

Azure OpenAI で関数呼び出しがサポートされるようになり、チャット入力候補 API で関数を操作できるようになりました。

入力配列の増加の埋め込み

Azure OpenAI では、text-embedding-ada-002 バージョン 2 を使用した API 要求あたり最大 16 の入力を含む配列がサポートされるようになりました。

新しいリージョン

Azure OpenAI は、カナダ東部、米国東部 2、東日本、米国中北部リージョンでも使用できるようになりました。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

2023 年 6 月

独自のデータに基づく Azure OpenAI を使用する (プレビュー)

Azure OpenAI On Your Data がプレビューでお使いいただけるようになりました。これにより、GPT-35-Turbo や GPT-4 などの OpenAI モデルとチャットし、データに基づいて応答を受信できます。

gpt-35-turbo および gpt-4 モデルの新しいバージョン

gpt-35-turbo (バージョン 0613)
gpt-35-turbo-16k (バージョン 0613)
gpt-4 (バージョン 0613)
gpt-4-32k (バージョン 0613)

英国南部

Azure OpenAI が米国南部リージョンで使用できるようになりました。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

コンテンツのフィルターと注釈 (プレビュー)

Azure OpenAI Service でコンテンツフィルターを構成する方法
注釈を有効にして、GPT ベースの Completion 呼び出しと Chat Completion 呼び出しの一部としてコンテンツフィルターカテゴリと重大度情報を表示します。

Quota

クォータを使用すると、サブスクリプション内のデプロイ全体で、レート制限の割り当てを柔軟に管理できます。

2023 年 5 月

Java と JavaScript SDK のサポート

JavaScript と Java のサポートを提供する新しい Azure OpenAI プレビュー SDK。

Azure OpenAI Chat Completion の一般提供 (GA)

一般提供サポート:
- Chat Completion API バージョン 2023-05-15。
- GPT-35-Turbo モデル。
- GPT-4 モデルシリーズ。

現在 2023-03-15-preview API を使用している場合は、GA 2023-05-15 API に移行することをお勧めします。現在 API バージョン 2022-12-01 を使用している場合、この API は GA のままですが、最新の Chat Completion 機能は含まれません。

重要

補完エンドポイントでの GPT-35-Turbo モデルの現在のバージョンの使用は、プレビュー段階のままです。

フランス中部

Azure OpenAI がフランス中部リージョンで使用できるようになりました。各リージョンでのモデル提供状況の最新情報は、モデルのページをご確認ください。

2023 年 4 月

DALL-E 2 パブリックプレビュー。 Azure OpenAI Service では、OpenAI の DALL-E 2 モデルを利用したイメージ生成 API がサポートされるようになりました。指定した説明テキストに基づいて、AI によって生成されたイメージを取得します。詳細については、クイックスタートを参照してください。アクセスをリクエストする場合、既存の Azure OpenAI のお客様は、このフォームに入力することで申請できます。
カスタマイズされたモデルの非アクティブなデプロイは、15 日後に削除されます。モデルは引き続き再デプロイに使用できます。 カスタマイズされた (微調整された) モデルが 15 日間を超えてデプロイされ、候補呼び出しやチャット候補呼び出しが行われなかった場合、デプロイは自動的に削除されます (そのデプロイに対するホスティング料金は発生しません)。基になるカスタマイズされたモデルは引き続き使用でき、いつでも再デプロイできます。詳しくは、操作方法に関する記事をご覧ください。

2023 年 3 月

GPT-4 シリーズモデルは、Azure OpenAI でプレビューで利用できるようになりました。アクセスをリクエストする場合、既存の Azure OpenAI のお客様は、このフォームに入力することで申請できます。これらのモデルは現在、米国東部と米国中南部のリージョンで使用できます。
3 月 21 日にプレビューでリリースされた、GPT-35-Turbo および GPT-4 モデル用の新しいチャット補完 API。詳細については、更新されたクイックスタートと操作方法に関する記事を参照してください。
GPT-35-Turbo プレビュー。詳細については、操作方法に関する記事を確認してください。
微調整のためにトレーニング制限を増加: トレーニングジョブの最大サイズ (トレーニングファイル内のトークン) x (エポック数) は、すべてのモデルに対して 20 億トークンになりました。また、最大トレーニングジョブを 120 時間から 720 時間に増やしました。
既存のアクセス権へのユースケースの追加。以前は、新しいユースケースを追加するプロセスで、お客様がサービスに再適用する必要がありました。現在、サービスの使用に新しいユースケースを迅速に追加できる、新しいプロセスをリリースしています。このプロセスは、Azure AI サービス内で確立されている制限付きアクセスプロセスに従っています。既存のお客様は、こちらからすべての新しいユースケースを証明できます。これは、最初に申請しなかった新しいユースケースでサービスを使用するときに必ず必要になるので注意してください。

2023 年 2 月

新機能

.NET SDK (推論) のプレビューリリース | サンプル
Azure OpenAI 管理操作をサポートするための Terraform SDK の更新。
suffix パラメーターを使用して入力候補の末尾にテキストを挿入できるようになりました。

更新プログラム

コンテンツのフィルター処理が既定でオンになっています。

次に関する新しい記事:

新しいトレーニングコース:

Azure OpenAI の概要

2023 年 1 月

新機能

サービス GA。 Azure OpenAI Service が一般提供になりました。
新しいモデル: 最新のテキストモデル text-davinci-003 (米国東部、西ヨーロッパ)、text-ada-embeddings-002 (米国東部、米国中南部、西ヨーロッパ) の追加

2022 年 12 月

新機能

OpenAI の最新モデル。 Azure OpenAI を使うと、GPT-3.5 シリーズを含むすべての最新モデルにアクセスできます。
新しい API バージョン (2022-12-01)。 この更新プログラムには、リクエストをいただいていた機能強化がいくつか含まれています。たとえば、API 応答でのトークン使用情報、ファイルのエラーメッセージの改善、作成データ構造の微調整に関する OpenAI との整合、微調整されたジョブのカスタム名前付けを可能にする suffix パラメーターのサポートなどです。
1 秒あたりの要求数の上限を引き上げました。 非 Davinci モデルの場合は 50。 Davinci モデルの場合は 20。
デプロイの微調整を高速化しました。 Ada と Curie の微調整されたモデルを 10 分未満でデプロイできます。
トレーニング上限を引き上げました: Ada、Babbage、Curie の場合は 40M トレーニングトークン。 Davinci の場合は 10M。
データログと人間によるレビューの不正使用と誤用に対する変更要求のプロセス。 現在、このサービスでは、これらの強力なモデルが不正使用されないように、不正使用と誤用を検出する目的で要求と応答のデータをログしています。ただし、多くのお客様はデータのプライバシーとセキュリティの要件が厳格なので、データをより細かく管理する必要があります。このようなユースケースをサポートするために、お客様がコンテンツフィルター処理ポリシーを変更することや、低リスクのユースケースで不正使用ログをオフにすることができる新しいプロセスをリリースしています。このプロセスは、Azure AI サービス内で確立されている制限付きアクセスプロセスに従っているため、既存の OpenAI のお客様はこちらからお申し込みいただけます。
カスタマーマネージドキー (CMK) の暗号化。 CMK にはトレーニングデータとカスタマイズされたモデルの格納に使われる独自の暗号化キーがあるので、お客様は Azure OpenAI のデータ管理をより細かく制御できます。カスタマーマネージドキー (CMK、Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます。また、データを保護するために使われる暗号化キーを監査することもできます。詳細については、保存時の暗号化ドキュメントを参照してください。
ロックボックスのサポート
SOC-2 への準拠
Azure Resource Health、コスト分析、メトリックと診断の設定を使ったログと診断。
Studio の機能強化。 微調整されたモデルの作成とデプロイにチーム内の誰がアクセスできるかを制御するための Azure AD ロールサポートを含め、Studio ワークフローのさまざまな点を使いやすくしました。

変更 (破壊的)

微調整: OpenAI のスキーマに合わせて、作成 API 要求が更新されました。

プレビュー API のバージョン:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API バージョン 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

既定でコンテンツのフィルター処理は一時的にオフです。 Azure コンテンツモデレーションは、Azure OpenAI とは異なる方法で動作します。 Azure OpenAI を使うと、生成呼び出し時にコンテンツフィルターを実行し、有害な、または不正使用のコンテンツとフィルターを検出し、応答から除外することができます。詳細情報

これらのモデルは 2023 年第 1 四半期に再び有効になり、既定でオンになります。

お客様のアクション

お使いのサブスクリプションでこれらを有効にする場合は、Azure サポートにお問い合わせください。
無効のままにする場合は、フィルター処理の変更をお申し込みください (このオプションは低リスクのユースケースに限定されます)。

次の手順

Azure OpenAI をサポートする基となるモデルに関する記事を確認します。

次の方法で共有

Azure OpenAI Service の新機能

2024 年 6 月

提供終了日の更新

微調整のためのトークン ベース課金

新しいリージョンで GPT-4o がリリースされました

Assistants 用のカスタマー マネージド キー (CMK) のサポート

2024 年 5 月

GPT-4o プロビジョニング済みデプロイ

Assistants v2 (プレビュー)

GPT-4o モデルの一般提供 (GA)

グローバル標準の展開の種類 (プレビュー)

微調整に関する更新

DALL-E および GPT-4 Turbo Vision GA の構成可能なコンテンツ フィルター

すべての Azure OpenAI カスタマーが利用できる非同期フィルター

プロンプト シールド

2024-05-01-preview API リリース

GPT-4 Turbo モデルの一般提供 (GA)

OpenAI と Azure OpenAI GPT-4 Turbo GA モデルの違い

gpt-4 vision-preview との違い

GPT-4 Turbo のプロビジョニングされたマネージド可用性

利用可能なリージョン

GPT-4 Turbo with Vision GA のデプロイ

2024 年 4 月

米国東部 2 とスイス西部という 2 つの新しいリージョンで微調整がサポートされるようになりました

米国東部 2

スイス西部

マルチターン チャット トレーニング例

GPT-4 (0125) は Azure OpenAI On Your Data で使用できます

2024 年 3 月

Azure OpenAI Studio でのリスクと安全性の監視

Azure OpenAI On Your Data の更新

2024-02-01 一般提供 (GA) API がリリースされました

Whisper 一般提供 (GA)

DALL-E 3 一般提供 (GA)

DALL-E 3 の新しいリージョン サポート

モデルの非推奨と提供終了

2024-03-01-preview API がリリースされました

GPT-4-1106-Preview アップグレード プランの更新

2024 年 2 月

GPT-3.5-turbo-0125 モデルが利用可能になりました

利用可能な第 3 世代埋め込みモデル

GPT-3.5 Turbo のクォータ統合

GPT-4-0125-preview モデルが利用可能

Assistants API パブリック プレビュー

OpenAI テキスト読み上げ音声パブリック プレビュー

新しいファインチューニング機能とモデルのサポート

独自のデータに基づく Azure OpenAI の新しいリージョン サポート

Azure OpenAI On Your Data の一般提供

2023 年 12 月

Azure OpenAI On Your Data

GPT-4 Turbo with Vision が利用可能

2023 年 11 月

Azure OpenAI On Your Data での新しいデータ ソース サポート

GPT-4 Turbo プレビューと GPT-3.5-Turbo-1106 のリリース

DALL-E 3 パブリック プレビュー

責任ある AI

2023 年 10 月

新しい微調整モデル (プレビュー)

Azure OpenAI On Your Data

2023 年 9 月

GPT-4

GPT-3.5 Turbo Instruct

Whisper パブリック プレビュー

新しいリージョン

リージョンのクォータ制限の引き上げ

2023 年 8 月

独自のデータに基づく Azure OpenAI (プレビュー) の更新

2023 年 7 月

関数呼び出しのサポート

入力配列の増加の埋め込み

新しいリージョン

2023 年 6 月

独自のデータに基づく Azure OpenAI を使用する (プレビュー)

gpt-35-turbo および gpt-4 モデルの新しいバージョン

英国南部

コンテンツのフィルターと注釈 (プレビュー)

Quota

2023 年 5 月

Java と JavaScript SDK のサポート

微調整のためのトークンベース課金

Assistants 用のカスタマーマネージドキー (CMK) のサポート

DALL-E および GPT-4 Turbo Vision GA の構成可能なコンテンツフィルター

プロンプトシールド

マルチターンチャットトレーニング例

DALL-E 3 の新しいリージョンサポート

GPT-4-1106-Preview アップグレードプランの更新

Assistants API パブリックプレビュー

OpenAI テキスト読み上げ音声パブリックプレビュー

独自のデータに基づく Azure OpenAI の新しいリージョンサポート

Azure OpenAI On Your Data での新しいデータソースサポート

DALL-E 3 パブリックプレビュー

Whisper パブリックプレビュー