Azure AI Studio のモデルカタログとコレクション

[アーティクル]
09/24/2024

重要

この記事で説明する機能の一部は、プレビューでのみ使用できる場合があります。このプレビューはサービスレベルアグリーメントなしで提供されており、運用環境ではお勧めしません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

Azure AI Studio のモデルカタログは、生成 AI アプリケーションを構築するための幅広いモデルを検索して使用するためのハブです。モデルカタログには、Microsoft によってトレーニングされたモデルを含む、Azure OpenAI Service、Mistral、Meta、Cohere、NVIDIA、Hugging Face などのモデルプロバイダーにわたる数百のモデルが取り上げられています。 Microsoft 以外のプロバイダーのモデルは、Microsoft 製品使用条件で定義されている、Microsoft 以外の製品であり、モデルに付属される条件に従います。

モデルコレクション

モデルカタログでは、モデルが次の 3 つの種類のコレクションに編成されています。

Azure AI によるキュレーション: Azure AI プラットフォーム上でシームレスに動作するようにパッケージ化され、最適化された、最も一般的な Microsoft 以外のオープンウェイトモデルとプロプライエタリモデル。これらのモデルの使用には、モデルプロバイダーのライセンス条項が適用されます。 Azure AI Studio でこれらのモデルをデプロイする場合、その可用性は Azure サービスレベルアグリーメント (SLA) が適用される対象となり、Microsoft はデプロイの問題に対するサポートを提供します。

Meta、NVIDIA、Mistral AI などのパートナーのモデルは、カタログ上のこのコレクションで利用できるモデルの例です。これらのモデルは、カタログ内のモデルタイルに緑色のチェックマークが付いているかどうかで特定できます。または、Azure AI によるキュレーション コレクションでフィルター処理することもできます。
Azure OpenAI モデル (Azure でのみ利用可能): Azure OpenAI Service との統合を通じて利用できる主力 Azure OpenAI モデル。 Microsoft は、製品使用条件および Azure OpenAI Service の SLA に従って、これらのモデルとその使用をサポートしています。
Hugging Face ハブのオープンモデル: マネージドコンピューティングによるリアルタイム推論のための Hugging Face ハブの数百のモデル。 Hugging Face は、このコレクションに掲載されているモデルを作成および維持しています。サポートが必要な場合は、Hugging Face フォーラムまたは Hugging Face サポートを利用してください。詳細については、Azure AI Studio を使用したオープンモデルのデプロイに関するページを参照してください。

このフォームを使用して、モデルカタログにモデルを追加する要求を送信できます。

モデルカタログ機能の概要

マネージドコンピューティングオプションを使用して、Azure AI によるキュレーションおよび Hugging Face ハブのオープンモデル コレクション内のモデルのいくつかをデプロイできます。一部のモデルは、従量課金制のサーバーレス API を介してデプロイできます。

これらのモデルを検出、比較、評価、微調整し (サポートされている場合)、大規模にデプロイできます。その後、エンタープライズレベルのセキュリティとデータガバナンスを備えた生成 AI アプリケーションにモデルを統合できます。次の一覧では、アクティビティについて詳しく説明します。

検索: モデルカードを確認し、サンプル推論を試し、コードサンプルを参照して、モデルの評価、微調整、またはデプロイを行います。
比較: 業界で利用可能なモデルとデータセットのベンチマークを比較して、どれが自社のビジネスシナリオに適合するかを評価できます。
評価: 独自のテストデータを提供して、モデルが特定のワークロードに適しているかどうかを評価します。評価メトリックを使用すると、選択したモデルがシナリオでどの程度適切に機能するかを視覚化できます。
微調整: 独自のトレーニングデータを使用して微調整可能なモデルをカスタマイズし、すべての微調整ジョブのメトリックを比較して最適なモデルを選択します。組み込みの最適化により、微調整が高速化され、必要なメモリとコンピューティングが削減されます。
デプロイ: 事前トレーニング済みモデルまたは微調整されたモデルを推論用にシームレスにデプロイします。マネージドコンピューティングにデプロイできるモデルをダウンロードすることもできます。

Azure OpenAI モデルの詳細については、「Azure OpenAI Service とは」を参照してください。

モデルデプロイ: マネージドコンピューティングとサーバーレス API (従量課金制)

モデルカタログには、マネージドコンピューティングとサーバーレス API という、使用するモデルをデプロイするための 2 つの異なる方法が用意されています。

次の表に示すように、モデルごとに使用できるデプロイオプションと機能は異なります。デプロイオプションを使用したデータ処理の詳細を確認してください。

機能	マネージドコンピューティング	サーバーレス API (従量課金制)
デプロイエクスペリエンスと課金	モデルの重みは、マネージドコンピューティングを備えた専用の仮想マシンにデプロイされます。マネージドコンピューティングは、1 つ以上のデプロイを持つことができ、推論に REST API が利用可能になります。デプロイで使用される仮想マシンのコア時間に対して課金されます。	モデルへのアクセスは、モデルにアクセスするための API をプロビジョニングするデプロイを通じて行われます。この API は、推論のために Microsoft がホストおよび管理するモデルへのアクセスを提供します。 API への入力と出力に対して (通常はトークンで) 課金されます。デプロイする前に価格情報が提供されます。
API 認証	キーと Microsoft Entra 認証。	キーのみ。
コンテンツの安全性	Azure AI Content Safety サービス API を使用します。	Azure AI Content Safety フィルターを、推論 API と統合して使用できます。 Azure AI Content Safety フィルターは、個別に課金されます。
ネットワークの分離	Azure AI Studio ハブ用にマネージドネットワークを構成する。	マネージドコンピューティングは、使用しているハブの公衆ネットワークアクセス (PNA) のフラグ設定に従います。詳細については、この記事で後述する「サーバーレス API を使用してデプロイされたモデルのネットワークの分離」を参照してください。

モデル	マネージドコンピューティング	サーバーレス API (従量課金制)
Llama ファミリモデル	Llama-2-7b Llama-2-7b-chat Llama-2-13b Llama-2-13b-chat Llama-2-70b Llama-2-70b-chat Llama-3-8B-Instruct Llama-3-70B-Instruct Llama-3-8B Llama-3-70B	Llama-3-70B-Instruct Llama-3-8B-Instruct Llama-2-7b Llama-2-7b-chat Llama-2-13b Llama-2-13b-chat Llama-2-70b Llama-2-70b-chat
Mistral ファミリモデル	mistralai-Mixtral-8x22B-v0-1 mistralai-Mixtral-8x22B-Instruct-v0-1 mistral-community-Mixtral-8x22B-v0-1 mistralai-Mixtral-8x7B-v01 mistralai-Mistral-7B-Instruct-v0-2 mistralai-Mistral-7B-v01 mistralai-Mixtral-8x7B-Instruct-v01 mistralai-Mistral-7B-Instruct-v01	Mistral-large (2402) Mistral-large (2407) Mistral-small Mistral-NeMo
Cohere ファミリモデル	使用不可	Cohere-command-r-plus-08-2024 Cohere-command-r-08-2024 Cohere-command-r-plus Cohere-command-r Cohere-embed-v3-english Cohere-embed-v3-multilingual Cohere-rerank-v3-english Cohere-rerank-v3-multilingual
JAIS	使用不可	jais-30b-chat
Phi-3 ファミリモデル	Phi-3-mini-4k-Instruct Phi-3-mini-128k-Instruct Phi-3-small-8k-Instruct Phi-3-small-128k-Instruct Phi-3-medium-4k-instruct Phi-3-medium-128k-instruct Phi-3-vision-128k-Instruct Phi-3.5-mini-Instruct Phi-3.5-vision-Instruct Phi-3.5-MoE-Instruct	Phi-3-mini-4k-Instruct Phi-3-mini-128k-Instruct Phi-3-small-8k-Instruct Phi-3-small-128k-Instruct Phi-3-medium-4k-instruct Phi-3-medium-128k-instruct Phi-3.5-mini-Instruct Phi-3.5-vision-Instruct Phi-3.5-MoE-Instruct
Nixtla	使用不可	TimeGEN-1
その他のモデル	使用可能	使用不可

マネージドコンピューティング

モデルをマネージドコンピューティングとしてデプロイする機能は、Azure Machine Learning のプラットフォーム機能に基づいて構築されており、大規模言語モデル (LLM) 操作のライフサイクル全体にわたって、モデルカタログ内のモデルの幅広いコレクションをシームレスに統合できます。

マネージドコンピューティングとしてデプロイするためのモデルの可用性

モデルは、Azure Machine Learning レジストリを通じて利用できます。これらのレジストリにより、Azure Machine Learning 資産のホスティングと配布に機械学習を優先するアプローチが可能になります。これらの資産には、モデルの重み、モデルを実行するためのコンテナーランタイム、モデルを評価および微調整するためのパイプライン、ベンチマークとサンプルのデータセットが含まれます。

レジストリは、高度にスケーラブルでエンタープライズ対応のインフラストラクチャの上に構築されており、次を実現します。

組み込みの geo レプリケーションで、低遅延のアクセスモデル成果物をすべての Azure リージョンに提供します。
Azure Policy を使用したモデルへのアクセスの制限や、マネージド仮想ネットワークを使用した安全なデプロイなど、エンタープライズセキュリティ要件をサポートします。

マネージドコンピューティングを使用した推論用モデルのデプロイ

マネージドコンピューティングへのデプロイに使用できるモデルは、Azure Machine Learning のマネージドコンピューティングにデプロイして、リアルタイム推論に利用できます。マネージドコンピューティングへのデプロイには、モデルを最適に実行するために必要な特定の製品に対する Azure サブスクリプションの仮想マシンクォータが必要です。一部のモデルでは、モデルのテスト用に一時的に共有されるクォータにデプロイできます。

モデルのデプロイの詳細については、次を参照してください。

マネージドコンピューティングを使用した生成 AI アプリの構築

Azure Machine Learning の "プロンプトフロー" 機能は、プロトタイプ作成に優れたエクスペリエンスを提供します。 Open Model LLM ツールでは、マネージドコンピューティングでデプロイされたモデルをプロンプトフローで使用できます。また、Azure Machine Learning 拡張機能を使用して、LangChain などの一般的な LLM ツールでマネージドコンピューティングによって公開される REST API を使用することもできます。

マネージドコンピューティングとしてデプロイされたモデルのコンテンツの安全性

Azure AI Content Safety サービスは、マネージドコンピューティングで使用して、性的コンテンツ、暴力、憎悪、自傷行為などのさまざまなカテゴリの有害なコンテンツをスクリーニングするために使用できます。このサービスを使用して、ジェイルブレイクリスク検出や保護されたマテリアルテキストの検出などの高度な脅威をスクリーニングすることもできます。

Llama 2 用 Azure AI Content Safety との統合のリファレンスについては、このノートブックを参照してください。または、プロンプトフローで Content Safety (テキスト) ツールを使用して、スクリーニングのためにモデルからの応答を Azure AI Content Safety に渡すこともできます。「Azure AI Content Safety の価格」で説明されているように、そのような使用に対しては別途課金されます。

従量課金制のサーバーレス API

モデルカタログ内の特定のモデルを、従量課金制のサーバーレス API としてデプロイできます。このデプロイ方法は、"サービスとしてのモデル" (MaaS) とも呼ばれ、モデルをサブスクリプションでホストせずに API として使用する方法を提供します。モデルは Microsoft が管理するインフラストラクチャでホストされ、モデルプロバイダーのモデルへの API ベースのアクセスが可能になります。 API ベースのアクセスにより、モデルにアクセスするコストが大幅に削減され、プロビジョニングエクスペリエンスがシンプルになります。

従量課金制のサーバーレス API としてデプロイできるモデルはモデルプロバイダーによって提供されますが、それらは Microsoft が管理する Azure インフラストラクチャでホストされ、API を介してアクセスされます。モデルプロバイダーはライセンス条項を定義し、モデルの利用価格を設定します。 Azure Machine Learning service。

ホスティングインフラストラクチャを管理します。
推論 API を使用できるようにします。
MaaS を使用してデプロイされたモデルによって送信されたプロンプトとコンテンツ出力のデータプロセッサとして機能します。

MaaS のデータ処理の詳細については、データプライバシーに関する記事を参照してください。

請求

MaaS を使用してデプロイされたモデルの検索、サブスクリプション、使用エクスペリエンスは、Azure AI Studio と Azure Machine Learning スタジオにあります。ユーザーはモデルの使用に関するライセンス条項に同意します。使用する価格情報はデプロイ時に提供されます。

Microsoft 以外のプロバイダーのモデルは、Microsoft コマーシャルマーケットプレースの利用規約に従って、Azure Marketplace を通じて課金されます。

Microsoft のモデルは、ファーストパーティ従量課金サービスとして Azure メーターを介して課金されます。製品使用条件に記載されているように、ファーストパーティ従量課金サービスは Azure メーターを使用して購入しますが、Azure サービス使用条件の対象ではありません。これらのモデルの使用には、提供されているライセンス条項が適用されます。

モデルの微調整

一部のモデルでは、サーバーレスの微調整もサポートされています。これらのモデルの場合、従量課金制のホストされたファインチューニングを利用して、ユーザーが提供したデータを使用してモデルを調整できます。詳細については、ファインチューニングの概要に関するページを参照してください。

サーバーレス API としてデプロイされたモデルを使用した RAG

Azure AI Studio では、ベクターインデックスと取得拡張生成 (RAG) を使用できます。サーバーレス API を使用してデプロイできるモデルを使用して、カスタムデータに基づいて埋め込みと推論を生成できます。これらの埋め込みと推論により、ユースケースに固有の回答を生成できます。詳細については、「Azure AI Studio でベクターインデックスを構築および使用する」に関する記事を参照してください。

オファーとモデルのリージョン別の利用可能性

従量課金制の課金を利用できるのは、所有している Azure サブスクリプションが、モデルプロバイダーがこのオファーを利用可能にしている国内の課金アカウントに属しているユーザーだけです。関連するリージョンでこのオファーが利用できる場合、ユーザーはモデルのデプロイまたはファインチューニングの内の必要な方が利用できる Azure リージョン内にハブ/プロジェクトを所有している必要があります。詳細については、「サーバーレス API エンドポイントでのモデルのリージョンごとの利用可能性 | Azure AI Studio」を参照してください。

サーバーレス API を使用してデプロイされたモデルのコンテンツの安全性

サーバーレス API を介してデプロイされた言語モデルの場合、Azure AI では、ヘイト、自傷行為、性的、暴力的なコンテンツなどの有害なコンテンツを検出する、Azure AI Content Safety テキストモデレーションフィルターの既定の構成が実装されます。コンテンツのフィルター処理 (プレビュー) の詳細については、「Azure AI Content Safety の有害なカテゴリ」を参照してください。

ヒント

コンテンツフィルタリング (プレビュー) は、サーバーレス API を介してデプロイされる特定のモデルの種類では使用できません。これらのモデルの種類には、埋め込みモデルと時系列モデルが含まれます。

コンテンツのフィルター処理 (プレビュー) は、サービスがコンテンツを生成するためのプロンプトを処理するときに同期的に行われます。そのような使用については、「Azure AI Content Safety の価格」に従って別途課金される場合があります。次のいずれかで、個々のサーバーレスエンドポイントのコンテンツのフィルター処理 (プレビュー) を無効にできます。

言語モデルを初めてデプロイした時点で
後から、デプロイの詳細ページでコンテンツのフィルター処理の切り替えの選択により

Azure AI モデル推論 API 以外の API を使用して、サーバーレス API 経由でデプロイされたモデルを操作することにしたとします。このような状況では、Azure AI Content Safety を使用して個別に実装しない限り、コンテンツフィルタリング (プレビュー) は有効になりません。

Azure AI Content Safety の概要については、「クイックスタート: テキストコンテンツの分析」を参照してください。サーバーレス API を使用してデプロイされたモデルを操作するときにコンテンツフィルタリング (プレビュー) を使用しない場合は、有害なコンテンツにユーザーをさらすリスクが高くなります。

サーバーレス API を使用してデプロイされたモデルのネットワークの分離

サーバーレス API としてデプロイされたモデルのマネージドコンピューティングは、デプロイが存在するプロジェクトがある AI Studio ハブの公衆ネットワークアクセスのフラグ設定に従います。マネージドコンピューティングのセキュリティ保護を促進するには、AI Studio ハブの公衆ネットワークアクセスフラグを無効にします。ハブのプライベートエンドポイントを使用すると、クライアントからマネージドコンピューティングへの受信通信のセキュリティ保護を促進できます。

AI Studio ハブの公衆ネットワークアクセスフラグを設定するには:

Azure ポータルにアクセスします。
ハブが属しているリソースグループを検索し、このリソースグループに一覧表示されているリソースから AI Studio ハブを選択します。
ハブの概要ページの左ペインで、[設定]>[ネットワーク] に移動します。
[パブリックアクセス] タブで、公衆ネットワークアクセスフラグの設定を構成できます。
変更を保存。変更が反映されるまでに最大 5 分かかる場合があります。

制限事項

2024 年 7 月 11 日より前に作成されたマネージドコンピューティングを持つ AI Studio ハブがある場合、このハブのプロジェクトに追加されたマネージドコンピューティングは、そのハブのネットワーク構成に従いません。代わりに、ハブの新しいマネージドコンピューティングを作成し、プロジェクトに新しいサーバーレス API デプロイを作成して、新しいデプロイがハブのネットワーク構成に従うことができるようにする必要があります。
2024 年 7 月 11 日より前に MaaS デプロイが作成された AI Studio ハブがあり、このハブでマネージドコンピューティングを有効にしている場合、既存の MaaS デプロイはハブのネットワーク構成に従いません。ハブ内のサーバーレス API デプロイでハブのネットワーク構成に従うようにするには、デプロイをもう一度作成する必要があります。
現在、プライベートハブでは公衆ネットワークアクセスフラグが無効になっているため、プライベートハブの MaaS デプロイでは Azure OpenAI On Your Data のサポートを利用できません。
ネットワーク構成の変更 (公衆ネットワークアクセスフラグの有効化または無効化など) が反映されるまでに最大 5 分かかる場合があります。

Azure AI Studio の基盤モデルについて確認する

次の方法で共有

Azure AI Studio のモデルカタログとコレクション

モデルコレクション

モデルカタログ機能の概要

モデルデプロイ: マネージドコンピューティングとサーバーレス API (従量課金制)

マネージドコンピューティング

マネージドコンピューティングとしてデプロイするためのモデルの可用性

マネージドコンピューティングを使用した推論用モデルのデプロイ

マネージドコンピューティングを使用した生成 AI アプリの構築

マネージドコンピューティングとしてデプロイされたモデルのコンテンツの安全性

従量課金制のサーバーレス API

請求

モデルの微調整

サーバーレス API としてデプロイされたモデルを使用した RAG

オファーとモデルのリージョン別の利用可能性

サーバーレス API を使用してデプロイされたモデルのコンテンツの安全性

サーバーレス API を使用してデプロイされたモデルのネットワークの分離

制限事項

フィードバック

その他のリソース

次の方法で共有

Azure AI Studio のモデルカタログとコレクション

モデル コレクション

モデルカタログ機能の概要

モデル デプロイ: マネージド コンピューティングとサーバーレス API (従量課金制)

マネージド コンピューティング

マネージド コンピューティングとしてデプロイするためのモデルの可用性

マネージド コンピューティングを使用した推論用モデルのデプロイ

マネージド コンピューティングを使用した生成 AI アプリの構築

マネージド コンピューティングとしてデプロイされたモデルのコンテンツの安全性

従量課金制のサーバーレス API

請求

モデルの微調整

サーバーレス API としてデプロイされたモデルを使用した RAG

オファーとモデルのリージョン別の利用可能性

サーバーレス API を使用してデプロイされたモデルのコンテンツの安全性

サーバーレス API を使用してデプロイされたモデルのネットワークの分離

制限事項

関連するコンテンツ

フィードバック

その他のリソース

モデルコレクション

モデルデプロイ: マネージドコンピューティングとサーバーレス API (従量課金制)

マネージドコンピューティング

マネージドコンピューティングとしてデプロイするためのモデルの可用性

マネージドコンピューティングを使用した推論用モデルのデプロイ

マネージドコンピューティングを使用した生成 AI アプリの構築

マネージドコンピューティングとしてデプロイされたモデルのコンテンツの安全性