カスタム テキスト分類とは
カスタム テキスト分類は、Azure AI Language で提供されているカスタム機能の 1 つです。 これは、機械学習インテリジェンスを適用して、テキスト分類タスク用のカスタム モデルを構築できるようにするクラウドベースの API サービスです。
カスタム テキスト分類を使用すると、ユーザーは、事前に定義したカスタム クラスにテキストを分類するカスタム AI モデルを構築できます。 開発者は、カスタム テキスト分類プロジェクトを作成することによって、繰り返しデータのラベル付けを行い、モデル パフォーマンスをトレーニング、評価、および改善してから、利用できるようにすることができます。 ラベル付けされたデータの品質は、モデルのパフォーマンスに大きく影響します。 モデルの構築とカスタマイズを簡単にするために、サービスには、Language Studio からアクセスできるカスタム Web ポータルが用意されています。 このクイックスタートの手順に従って、サービスを簡単に開始できます。
カスタム テキスト分類では、次の 2 種類のプロジェクトがサポートされています。
- 単一ラベル分類 - データセットの各ドキュメントに単一のクラスを割り当てることができます。 たとえば、1 本の映画の脚本を "ロマンス" と "コメディ" のどちらかに分類できます。
- 複数ラベル分類 - データセットの各ドキュメントに複数のクラスを割り当てることができます。 たとえば、1 本の映画の脚本を "コメディ" か、"ロマンス" かつ "コメディ" に分類できます。
このドキュメントには、次の種類の記事が含まれています。
- クイックスタートは、サービスへの要求の実行方法を説明する概要手順です。
- 概念では、サービスの機能と特徴について説明します。
- 攻略ガイドには、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。
使用シナリオの例
カスタム テキスト分類は、さまざまな業界の複数のシナリオで使用できます。
電子メールまたはチケットの自動トリアージ
あらゆる種類のサポート センターでは、構造化されていない自由形式のテキストと添付ファイルを含む大量の電子メールまたはチケットが受信されます。 タイムリーなレビュー、受信確認、社内チーム内における主題領域専門家へのルーティングが非常に重要です。 人間がレビューし、適切な部門にルーティングする必要があるこの規模での電子メールのトリアージには、時間とリソースが必要になります。 カスタム テキスト分類を使用すると、受信したテキストのトリアージを分析し、コンテンツを分類して、追加のアクションのために自動的に関連部門にルーティングできます。
セマンティック検索を強化するためのナレッジ マイニング
検索は、ユーザーにテキスト コンテンツを表示するすべてのアプリの基本となるものです。 一般的なシナリオとしては、カタログやドキュメントの検索、小売製品の検索、データ サイエンスのナレッジ マイニングなどがあります。 さまざまな業界にわたる多くの企業が、構造化および非構造化ドキュメントの両方を含む、プライベートで異種なコンテンツに対して高度な検索エクスペリエンスを構築しようと検討しています。 そのパイプラインの一部として、開発者はカスタム テキスト分類を使用して、テキストをそれぞれの業界に関連するクラスに分類できます。 これらの予測されたクラスを使用してファイルのインデックス作成を強化することで、よりカスタマイズされた検索エクスペリエンスを実現できます。
プロジェクト開発ライフサイクル
カスタム テキスト分類プロジェクトの作成には、通常、いくつかの異なる手順が含まれます。
モデルを最大限に活用するには、次の手順に従ってください。
スキーマを定義する: データを認識し、区別するクラスを特定し、あいまいさを回避します。
データのラベル付け: データのラベル付けの品質は、モデルのパフォーマンスを決める重要な要素です。 同じクラスに属するドキュメントは常に同じクラスを持つ必要があります。2 つのクラスに分類できるドキュメントがある場合は、複数ラベル分類プロジェクトを使用します。 クラスのあいまいさは避け、特に単一ラベル分類プロジェクトでは、クラスを互いに明確に分離できる必要があります。
モデルをトレーニングする: モデルは、ラベル付けされたデータから学習を開始します。
モデルのパフォーマンスを表示する: モデルの評価の詳細を表示して、新しいデータが導入された場合のパフォーマンスを判断します。
モデルをデプロイする: モデルをデプロイすると、Analyze API を介して使用できるようになります。
テキストを分類する: カスタム テキスト分類タスク用のカスタム モデルを使用します。
リファレンス ドキュメントとコード サンプル
カスタム テキスト分類を使用する場合は、次の Azure AI Language のリファレンス ドキュメントとサンプルをご覧ください。
開発オプション/言語 | リファレンス ドキュメント | サンプル |
---|---|---|
REST API (オーサリング) | REST API のドキュメント | |
REST API (ランタイム) | REST API のドキュメント | |
C# (ランタイム) | C# 関連のドキュメント | C# サンプル - 単一ラベル分類 C# サンプル - 複数ラベル分類 |
Java (ランタイム) | Java のドキュメント | Java サンプル - 単一ラベル分類 Java サンプル - 複数ラベル分類 |
JavaScript (ランタイム) | JavaScript のドキュメント | JavaScript サンプル - 単一ラベル分類 JavaScript サンプル - 複数ラベル分類 |
Python (ランタイム) | Python のドキュメント | Python サンプル - 単一ラベル分類 Python サンプル - 複数ラベル分類 |
責任ある AI
AI システムには、テクノロジだけでなく、それを使う人、それによって影響を受ける人、それがデプロイされる環境も含まれます。 システムでの責任ある AI の使用とデプロイについては、カスタム テキスト分類の透明性に関する注意に関するページをご覧ください。 詳細については、次の記事も参照してください。
次のステップ
クイックスタートに関する記事を使用して、カスタム テキスト分類の使用を開始します。
プロジェクト開発ライフサイクルを進める過程で、この機能のドキュメント全体で使用される用語の詳細については、「用語集」を参照してください。
リージョンの可用性などの情報については、「サービスの制限」を必ずご覧ください。