キー フレーズ抽出を使用する方法
キー フレーズ抽出機能を使うと、非構造化テキストを評価し、各ドキュメントについてキー フレーズのリストを返すことができます。
この機能は、ドキュメントのコレクション内の要点をすばやく特定する必要がある場合に便利です。 たとえば、"食べ物はおいしく、スタッフはすばらしかった" というテキストを入力すると、サービスから "食べ物" と "すばらしいスタッフ" というメイン トピックが返されます。
ヒント
クイック スタートの記事に従って、この機能を使い始めることができます。 また、Language Studio を使うと、コードを記述しなくても要求の例を作成できます。
開発オプション
キー フレーズ抽出を使用するには、分析のために未加工の非構造化テキストを送信し、お使いのアプリケーションで API 出力を処理します。 分析はそのままの状態で行われ、データに使用されるモデルに対して追加のカスタマイズは行われません。 キー フレーズ抽出を使用するには、次の 2 つの方法があります。
開発オプション | 説明 |
---|---|
Language Studio | Language Studio は Web ベースのプラットフォームであり、Azure アカウントがなければテキストの例で、サインアップしたら独自のデータで、エンティティ リンクを試すことができます。 詳しくは、Language Studio の Web サイトまたは Language Studio のクイックスタートに関する記事をご覧ください。 |
REST API またはクライアント ライブラリ (Azure SDK) | さまざまな言語で使用できる REST API、またはクライアント ライブラリを使用して、キー フレーズ抽出をお使いのアプリケーションに統合します。 詳しくは、キー フレーズ抽出のクイックスタートに関するページをご覧ください。 |
Docker コンテナー | 利用できる Docker コンテナーを使って、この機能をオンプレミスに展開します。 これらの Docker コンテナーを使用すると、コンプライアンス、セキュリティ、またはその他の運用上の理由により、データにいっそう近いところにサービスを持ってくることができます。 |
データの処理方法を決定する (省略可能)
キー フレーズ抽出モデルを指定する
既定では、テキストで利用できる最新の AI モデルがキー フレーズ抽出によって使われます。 特定のバージョンのモデルを使うように API 要求を構成することもできます。
入力言語
キー フレーズ抽出で処理されるドキュメントを送信するときに、サポートされている言語のどれでそれが書かれているかを指定できます。言語を指定しないと、英語がキー フレーズ抽出によって既定で使われます。 さまざまな多言語と絵文字のエンコードをサポートするため、API からの応答でオフセットが返される場合があります。
データの送信
キー フレーズ抽出は、扱うテキストの量が多いほど効果を発揮します。 感情分析では逆で、テキストの量が少ないほどパフォーマンスが向上します。 両方の操作から最善の結果を得るには、両方の操作に応じて入力を再構成することを検討してください。
API 要求を送信するには、言語リソースのエンドポイントとキーが必要です。
Note
言語リソースのキーとエンドポイントは、Azure portal で確認できます。 それらは、リソースの [Key and endpoint](キーとエンドポイント) ページの [リソース管理] にあります。
要求が受信されると分析が実行されます。 キー フレーズ抽出機能の同期的な使用はステートレスです。 データはアカウントに保存されず、結果がすぐに応答で返されます。
この機能を非同期的に使うと、API の結果は、応答で示される要求取り込み時刻から 24 時間利用できます。 この時間が経過すると、結果は消去され、取得できなくなります。
キー フレーズ抽出の結果の取得
API から結果を受け取るとき、返されるキー フレーズの順序は、モデルによって内部的に決定されます。 結果をアプリケーションにストリーミングすることも、ローカル システムのファイルに出力を保存することもできます。
サービスとデータの制限
分単位および秒単位で送信できる要求のサイズと数については、サービスの制限に関する記事を参照してください。