Azure OpenAI Service でコンテンツフィルターを構成する方法

[アーティクル]
09/27/2024

Azure OpenAI Service に統合されたコンテンツフィルタリングシステムは、DALL-E イメージ生成モデルを含むコアモデルと共に実行されます。マルチクラス分類モデルのアンサンブルを使用して、有害なコンテンツ (暴力、憎悪、性的、自傷行為) の 4 つのカテゴリをそれぞれ 4 つの重大度レベル (安全、低、中、高) で検出し、オプションで二項分類器を使用して、脱獄リスク、既存のテキスト、パブリックリポジトリ内のコードを検出します。既定のコンテンツフィルタリング構成では、プロンプトと入力候補の両方で、4 つの有害なコンテンツカテゴリすべてに対して "中" の重大度しきい値でフィルター処理するように設定されています。つまり、重大度レベル "中" または "高" で検出されたコンテンツはコンテンツフィルターによってフィルタリングされますが、重大度レベル "低" で検出されたコンテンツはフィルタリングされません。コンテンツカテゴリ、重大度レベル、およびコンテンツフィルタリングシステムの動作の詳細については、こちらを参照してください。脱獄リスク検出、保護されたテキスト、およびコードモデルは省略可能で、既定ではオフになっています。脱獄、保護された素材のテキスト、およびコードモデルについては、構成可能性機能により、すべてのお客様がモデルのオン/オフを切り替えることができます。モデルは既定ではオフになっており、シナリオに応じてオンにできます。モデルによっては、Customer Copyright Commitment の適用範囲を維持するために、特定のシナリオでオンになっている必要がある場合があります。

Note

すべての顧客は、コンテンツフィルターを変更し、重大度のしきい値 (低、中、高) を構成できます。コンテンツフィルターを部分的または完全にオフにする場合は、承認が必要です。管理対象のお客様は、Azure OpenAI 制限付きアクセスレビュー: 変更されたコンテンツフィルターというフォームを介してのみ、完全なコンテンツフィルター制御を適用できます。現時点では、管理対象のお客様になることはできません。

コンテンツフィルターは、リソースレベルで構成できます。新しい構成を作成したら、1 つ以上のデプロイに関連付けることができます。モデルデプロイの詳細については、リソースデプロイガイドを参照してください。

前提条件

コンテンツフィルターを構成するには、Azure OpenAI リソースと大規模言語モデル (LLM) のデプロイが必要です。クイックスタートに従って始めてください。

コンテンツフィルターの構成可否について

Azure OpenAI Service には、(Azure OpenAI Whisper を除く) すべてのモデルに適用される既定の安全性の設定が含まれています。これらの構成により、コンテンツフィルタリングモデル、ブロックリスト、プロンプト変換、コンテンツ資格情報など、責任あるエクスペリエンスが既定で提供されます。詳細については、こちらを参照してください。

また、すべてのお客様は、コンテンツフィルターを構成し、ユースケースの要件に合わせたカスタム安全性ポリシーを作成することもできます。この構成機能を使用すると、利用者はプロンプトと補完の設定を個別に調整し、以下の表に示す異なる重大度レベルで各コンテンツカテゴリのコンテンツをフィルター処理できます。重大度レベル "安全" で検出されたコンテンツは注釈でラベル付けされますが、フィルタリングの対象ではなく、構成もできません。

フィルタリングされた重大度	プロンプト用に構成可能	入力候補用に構成可能	説明
[低]、[中]、[高]	はい	はい	最も厳密なフィルタリング構成。重大度レベルが低、中、高で検出されたコンテンツはフィルタリングされます。
中、高	はい	はい	低い重大度レベルの検出されたコンテンツはフィルター処理されず、中および高のコンテンツはフィルター処理されます。
高	はい	はい	重大度レベルが低および中で検出されたコンテンツはフィルター処理されません。重大度レベルが高のコンテンツのみがフィルタリングされます。
フィルターなし	承認された場合 ¹	承認された場合 ¹	重大度レベルの検出に関係なく、コンテンツはフィルタリングされません。承認が必要¹.
注釈のみ	承認された場合 ¹	承認された場合 ¹	フィルター機能を無効にするため、コンテンツはブロックされませんが、注釈は API 応答を介して返されます。承認が必要¹.

¹ Azure OpenAI モデルの場合、変更されたコンテンツフィルタリングを承認されたお客様のみコンテンツのフィルター処理を完全に制御でき、コンテンツフィルターをオフにできます。次のフォームから修正コンテンツフィルターを申請してください: Azure OpenAI 制限付きアクセスレビュー: 修正コンテンツフィルター。 Azure Government のお客様の場合は、次のフォームから修正コンテンツフィルターを申請してください: Azure Government - Azure OpenAI Service の修正コンテンツフィルタリングのリクエスト。

入力 (プロンプト) と出力 (入力候補) の構成可能なコンテンツフィルターは、次の Azure OpenAI モデルで利用できます。

GPT モデルシリーズ
GPT-4 Turbo Vision GA^* (turbo-2024-04-09)
GPT-4o
GPT-4o mini
DALL-E 2 と 3

構成可能コンテンツフィルターは、以下では利用できません

o1-preview
o1-mini

^*GPT-4 Turbo Vision GA でのみ利用でき、GPT-4 Turbo Vision プレビューには適用されません

コンテンツフィルタリング構成は、Azure AI Studio のリソース内に作成され、デプロイに関連付けることができます。構成可能性の詳細については、こちらを参照してください。

Azure OpenAI を統合するアプリケーションが倫理規定に準拠していることを確認する責任は、お客様にあります。

その他のフィルターについて

既定の危害カテゴリフィルターに加えて、次のフィルターカテゴリを構成できます。

フィルターカテゴリー	状態	既定の設定	プロンプトと入力候補のどちらに適用されますか?	説明
直接攻撃に関するプロンプトシールド (ジェイルブレイク)	GA	オン	ユーザープロンプト	ジェイルブレイクリスクがあるかもしれないユーザープロンプトをフィルター処理/注釈付けします。注釈の詳細については、「Azure OpenAI Service のコンテンツフィルタリング」を参照してください。
間接攻撃に関するプロンプトシールド	GA	オン	ユーザープロンプト	生成 AI システムがアクセスして処理できるドキュメント内に、第三者が悪意のある命令を配置する潜在的な脆弱性である間接攻撃 (別名、間接プロンプト攻撃またはクロスドメインプロンプトインジェクション攻撃) をフィルター処理/注釈付けします。必須: ドキュメントフォーマット。
保護された素材 - コード	GA	オン	完了	保護されたコードをフィルター処理するか、GitHub Copilot を利用して何らかのパブリックコードソースと一致するコードスニペット用の注釈内の引用とライセンスの情報の例を取得します。注釈の使用に関する詳細については、「コンテンツのフィルター処理の概念のガイド」を参照してください
保護された素材 - テキスト	GA	オン	完了	既知のテキストコンテンツを識別し、モデル出力内でそれが表示されることをブロックします (たとえば、曲の歌詞、レシピ、選択した Web コンテンツなど)。

Azure OpenAI Studio を介したコンテンツフィルターの構成

次の手順では、リソースのカスタマイズされたコンテンツフィルタリング構成を設定する方法を示します。

Azure OpenAI Studio に移動し、[コンテンツフィルター] タブに移動します (左下のナビゲーションで、下の赤いボックスで指定されています)。
カスタマイズされた新しいコンテンツフィルタリングの構成を作成します。

これにより、次の構成ビューが表示されます。ここでは、カスタムコンテンツフィルタリング構成の名前を選択できます。
これは、既定のコンテンツフィルタリング構成のビューで、コンテンツはすべてのカテゴリに対して中および高の重大度レベルでフィルタリングされます。 4 つのコンテンツカテゴリ (下の緑色のボックスで示されているように、画面の左側にコンテンツカテゴリが一覧表示されます) ごとに、ユーザープロンプトとモデルの入力候補の両方のコンテンツフィルターの重要度レベルを個別に変更できます (下の青いボックスで示されているように、プロンプトの構成は左側の列にあり、入力候補の構成は右側の列にあります)。各カテゴリには、構成可能な次の 3 つの重大度レベルがあります: 低、中、高。スライダーを使用して重大度のしきい値を設定できます。
アプリケーションまたは使用シナリオで、一部またはすべてのコンテンツカテゴリに対してより厳密なフィルタリングが必要であると判断した場合は、プロンプトと入力候補を個別に構成して、デフォルト設定よりも高い重大度レベルでフィルタリングできます。次の図に例を示します。ユーザープロンプトのフィルタリングレベルは、憎悪と性的の最も厳密な構成に設定され、重大度が低のコンテンツは、重大度が中および高として分類されたコンテンツと共にフィルタリングされます (下の赤いボックスで囲まれた部分)。この例では、モデル入力候補のフィルタリングレベルは、すべてのコンテンツカテゴリに対して最も厳密な構成で設定されています (下の青いボックス)。この変更されたフィルタリング構成を適用すると、ユーザープロンプトで低、中、高の重大度のコンテンツが、憎悪と性的カテゴリでフィルタリングされます。中および高の重大度のコンテンツは、ユーザープロンプトで自傷行為および暴力のカテゴリでフィルタリングされます。低、中、高の重大度のコンテンツは、モデル入力候補のすべてのコンテンツカテゴリに対してフィルタリングされます。
前述のように変更されたコンテンツフィルターに対してユースケースが承認された場合は、コンテンツフィルタリング構成を完全に制御でき、フィルター処理の一部またはすべてをオフにできます。以下の画像では、暴力 (下の緑のボックス) についてはフィルター処理がオフになっていますが、その他のカテゴリについては既定の設定が保持されます。これにより、暴力のフィルター機能は無効になりましたが、コンテンツには引き続き注釈が付けられます。すべてのフィルターと注釈をオフにするには、フィルターと注釈をオフに切り替えます (下の赤のボックス)。

要件に従って、複数のコンテンツフィルタリング構成を作成できます。
オプションモデルをオンにするには、左側のチェックボックスのいずれかを選択します。各オプションモデルをオンにすると、モデルで注釈を付けるかフィルター処理するかを指定できます。
[注釈] を選択すると、それぞれのモデルが実行され、API 応答を介して注釈が返されますが、コンテンツはフィルタリングされません。注釈に加えて、フィルタートグルをオンに切り替えることで、コンテンツをフィルター処理することもできます。
要件に従って、複数のコンテンツフィルタリング構成を作成できます。
次に、カスタムコンテンツフィルタリング構成を操作できるようにするには、リソース内の 1 つ以上のデプロイに構成を割り当てます。これを行うには、[デプロイ] タブに移動し、[デプロイの編集] を選択します (画面の上部付近の赤いボックスで囲まれた部分)。
詳細オプション (下の青いボックスで囲まれています) に移動し、[コンテンツフィルター] ドロップダウンからデプロイに適したコンテンツフィルターの構成を選択します (ダイアログボックスの下部付近にある、下の赤いボックスで囲まれた部分)。
[保存して閉じる] を選択して、選択した構成をデプロイに適用します。
必要に応じて、コンテンツフィルター構成を編集および削除することもできます。これを行うには、[コンテンツフィルター] タブに移動し、目的のアクション (画面の上部付近にある下の赤いボックスで囲まれたオプション) を選択します。一度に編集/削除できるフィルタリング構成は 1 つだけです。

Note

コンテンツフィルタリング構成を削除する前に、[デプロイ] タブでデプロイから割り当てを解除する必要があります。

ベストプラクティスに従う

反復的な特定 (レッドチームテスト、ストレステスト、分析など) と測定のプロセスを通じてコンテンツフィルタリング構成の決定を通知し、特定のモデル、アプリケーション、デプロイシナリオに関連する潜在的な損害に対処することをお勧めします。コンテンツフィルタリングなどの軽減策を実装した後、測定を繰り返して有効性をテストします。 Microsoft Responsible AI Standard に基づいた Azure OpenAI の Responsible AI に関する推奨事項とベストプラクティスについては、「Azure OpenAI の Responsible AI の概要」を参照してください。

Azure OpenAI の Responsible AI プラクティスの詳細については、「Azure OpenAI モデルの Responsible AI プラクティスの概要」に関するページを参照してください。
詳細については、Azure OpenAI Service を使用した「コンテンツフィルタリングカテゴリと重大度レベル」に関するページを参照してください。
レッドチーミングの詳細については、「大規模言語モデル (LLM) のレッドチーミングの概要」の記事を参照してください。

次の方法で共有

Azure OpenAI Service でコンテンツフィルターを構成する方法

前提条件

コンテンツフィルターの構成可否について

その他のフィルターについて

Azure OpenAI Studio を介したコンテンツフィルターの構成

ベストプラクティスに従う

フィードバック

その他のリソース

次の方法で共有

Azure OpenAI Service でコンテンツ フィルターを構成する方法

前提条件

コンテンツ フィルターの構成可否について

その他のフィルターについて

Azure OpenAI Studio を介したコンテンツ フィルターの構成

ベスト プラクティスに従う

関連するコンテンツ

フィードバック

その他のリソース

Azure OpenAI Service でコンテンツフィルターを構成する方法

コンテンツフィルターの構成可否について

Azure OpenAI Studio を介したコンテンツフィルターの構成

ベストプラクティスに従う