カスタムカテゴリ

[アーティクル]
09/03/2024

Azure AI Content Safety を使用すると、特定のポリシーやユースケースに一致する強化されたモデレーションとフィルター処理のために、独自のコンテンツモデレーションカテゴリを作成して管理できます。

カスタマイズの種類

カスタムカテゴリを定義して使用する方法は複数あります。このセクションで、その詳細と比較を示します。

API	機能
カスタムカテゴリ (標準) API	カスタマイズ可能な機械学習モデルを使用して、カスタマイズされたカテゴリを作成、取得、クエリ、削除します。または、カスタマイズしたすべてのカテゴリをリストして、さらに注釈タスクを行います。
カスタムカテゴリ (急速) API	大規模言語モデル (LLM) を使用して、新たに発生するコンテンツインシデントの特定のコンテンツパターンをすばやく学習します。

カスタムカテゴリ (標準) API

カスタムカテゴリ (標準) API を使用すると、顧客はニーズに固有のカテゴリを定義し、サンプルデータを提供し、カスタム機械学習モデルをトレーニングし、それを使用して、学習したカテゴリに従って新しいコンテンツを分類できます。

これは、機械学習モデルを使用したカスタマイズの標準的なワークフローです。トレーニングデータの品質によっては、非常に優れたパフォーマンスレベルに達する可能性がありますが、モデルのトレーニングには数時間かかることがあります。

この実装はテキストコンテンツに対して機能しますが、画像コンテンツに対しては機能しません。

カスタムカテゴリ (急速) API

カスタムカテゴリ (急速) API は、標準の手法よりも迅速かつ柔軟になるように設計されています。これは、オンラインプラットフォーム上の不適切または有害なコンテンツに関わるサイバーインシデントの特定、分析、根絶、その後の復旧のために使用することを目的としたものです。

インシデントには、Microsoft コミュニティガイドラインまたはお客様独自のポリシーや期待に違反する一連の新しいコンテンツパターン (テキスト、画像、またはその他のモダリティ) が含まれる場合があります。ライブサイトの潜在的な問題や、ユーザーやコミュニティに対する危害を回避するには、これらのインシデントを迅速かつ正確に軽減する必要があります。

この実装はテキストコンテンツと画像コンテンツに対して機能します。

ヒント

新しいコンテンツインシデントに対処するための 1 つの方法は、ブロックリストを使用することですが、これはテキストの完全一致のみを許可し、画像の一致は許可されません。カスタムカテゴリ (急速) API では、次の高度な機能が提供されます。

軽量の分類子による埋め込み検索を使用したセマンティックテキスト照合
軽量のオブジェクト追跡モデルと埋め込み検索を使用した画像照合。

Azure AI Content Safety のカスタムカテゴリ機能では、カスタムコンテンツ分類モデルを作成、トレーニング、使用するためにマルチステッププロセスが使用されます。ワークフローは次のようになります。

ステップ 1: 定義とセットアップ

カスタムカテゴリを定義するときは、識別するコンテンツの種類を AI に教える必要があります。このためには、明確なカテゴリ名と、コンテンツの特性をカプセル化した詳細な定義を提供する必要があります。

次に、肯定的な例と (必要に応じて) 否定的な例のバランスの取れたデータセットを収集して、AI がカテゴリの微妙な部分を学習できるようにします。このデータは、実際のシナリオでモデルが遭遇するさまざまなコンテンツを代表するものである必要があります。

ステップ 2: モデルトレーニング

データセットを準備してカテゴリを定義すると、Azure AI Content Safety サービスによって新しい機械学習モデルがトレーニングされます。このモデルでは、定義とアップロードされたデータセットを使用して、大規模な言語モデルを使用してデータ拡張を実行します。その結果、トレーニングデータセットのサイズが大きくなり、品質が向上します。トレーニング中、AI モデルはデータを分析し、指定されたカテゴリに合ったコンテンツとそうでないコンテンツを区別することを学習します。

ステップ 3: モデル推論

トレーニング後、モデルを評価して、正確性の要件を満たしていることを確認する必要があります。まだ受け取ったことがない新しいコンテンツでモデルをテストします。評価フェーズは、運用環境にモデルをデプロイするために必要な潜在的な調整を特定するのに役立ちます。

ステップ 4: モデルの使用

analyzeCustomCategory API を使用して、テキストコンテンツを分析し、定義したカスタムカテゴリと一致するかどうかを判断します。サービスは、コンテンツが指定したカテゴリに一致するかどうかを示すブール値を返します。

制限事項

利用できる言語

カスタムカテゴリの API では、Content Safety のテキストモデレーションでサポートされているすべての言語がサポートされます。言語のサポートに関するページを参照してください。

入力制限

カスタムカテゴリ (標準) API
カスタムカテゴリ (急速) API

カスタムカテゴリ (標準) API の入力制限については、次の表を参照してください。

Object	制限事項
サポートされている言語	英語のみ
ユーザーごとのカテゴリの数	3
カテゴリごとのバージョン数	3
カテゴリごとの同時実行ビルド (プロセス) の数	1
1 秒あたりの推論操作数	5
カテゴリバージョン内のサンプル数	肯定的サンプル (必須): 最小 50、最大 5,000 合計 (否定的サンプルと肯定的サンプルの両方): 10,000 重複するサンプルは許可されません。
サンプルファイルサイズ	最大 128,000 バイト
テキストサンプルの長さ	最大 125,000 文字
カテゴリ定義の長さ	最大 1,000 文字
カテゴリ名の長さ	最大 128 文字
BLOB URL の長さ	最大 500 文字

カスタムカテゴリ (急速) API の入力制限については、次の表を参照してください。

Object	制限事項
インシデント名の最大長	100 文字
テキストまたは画像サンプルのインシデントあたりの最大数	1000
各サンプルの最大サイズ	テキスト: 500 文字画像: 4 MB
テキストまたは画像インシデントのリソースあたりの最大数	100
サポートされる画像形式	BMP、GIF、JPEG、PNG、TIF、WEBP

利用可能なリージョン

これらの API を使用するには、サポートされているリージョンのいずれかに Azure AI Content Safety リソースを作成する必要があります。利用可能なリージョンに関するページを参照してください。

次のステップ

攻略ガイドに従って、Azure AI Content Safety API を使用してカスタムカテゴリを作成します。

次の方法で共有

カスタムカテゴリ

カスタマイズの種類

カスタムカテゴリ (標準) API

カスタムカテゴリ (急速) API

しくみ

ステップ 1: 定義とセットアップ

ステップ 2: モデルトレーニング

ステップ 3: モデル推論

ステップ 4: モデルの使用

制限事項

利用できる言語

入力制限

利用可能なリージョン

次のステップ

フィードバック

その他のリソース

次の方法で共有

カスタム カテゴリ

カスタマイズの種類

カスタム カテゴリ (標準) API

カスタム カテゴリ (急速) API

しくみ

ステップ 1: 定義とセットアップ

ステップ 2: モデル トレーニング

ステップ 3: モデル推論

ステップ 4: モデルの使用

制限事項

利用できる言語

入力制限

フィードバック

その他のリソース

カスタムカテゴリ

カスタムカテゴリ (標準) API

カスタムカテゴリ (急速) API

ステップ 2: モデルトレーニング