キーフレーズ抽出コグニティブスキル

[アーティクル]
09/01/2024

キーフレーズ抽出スキルは、非構造化テキストを評価し、各レコードに対してキーフレーズのリストを返します。このスキルでは、Azure AI Language で提供されるキーフレーズ機械学習モデルが使用されます。

この機能は、レコード内の要点をすばやく特定する必要がある場合に便利です。たとえば、「食べ物はおいしくて、すばらしいスタッフがいた」というテキストを入力すると、 "食べ物" と "すばらしいスタッフ" がサービスによって返されます。

Note

このスキルは Azure AI サービスにバインドされており、1 日にインデクサーあたり 20 ドキュメントを超えるトランザクションには課金対象リソースが必要です。組み込みスキルの実行は、既存の Azure AI サービスの従量課金制の価格で課金されます。

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

データ制限

レコードのサイズは、String.Length で測定して 50,000 文字以下にする必要があります。データをキーフレーズエクストラクターに送信する前に分割する必要がある場合は、テキスト分割スキルの使用を検討してください。テキスト分割スキルを使用する場合は、最適なパフォーマンスを得るためにページの長さを 5000 に設定します。

スキルのパラメーター

パラメーターの大文字と小文字は区別されます。

入力	説明
`defaultLanguageCode`	(省略可能) 言語を明示的に指定しないドキュメントに適用する言語コード。既定の言語コードが指定されていない場合は、既定の言語コードとして英語 (en) が使用されます。サポートされる言語の完全な一覧を参照してください。
`maxKeyPhraseCount`	(省略可能) 生成するキーフレーズの最大数。
`modelVersion`	(省略可能) キーフレーズ API を呼び出すときに使用するモデルのバージョンを指定します。既定値は、指定されていない場合に使用可能な最新の値です。必要な場合以外は、この値を指定しないことをお勧めします。

スキルの入力

入力	説明
`text`	分析されるテキスト。
`languageCode`	レコードの言語を示す文字列。このパラメータが指定されていない場合は、既定の言語コードを使用してレコードが分析されます。サポートされる言語の完全な一覧を参照してください。

スキルの出力

出力	説明
`keyPhrases`	入力テキストから抽出されたキーフレーズの一覧。キーフレーズは、重要度順に返されます。

定義例

次のフィールドを持つ SQL レコードを検討してみます。

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

その後、スキル定義は次のようになります：

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

サンプル出力

前の例では、スキルの出力は、「document/myKeyPhrases」というエンリッチされたツリー内の新しいノードに書き込まれます。これは、指定した targetName であるためです。 targetName が指定されていない場合は、"document/keyPhrases" になります。

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

「document/myKeyPhrases」は、他のスキルへの入力として、または出力フィールドマッピングのソースとして使用できます。

Warnings

サポートされていない言語コードを指定すると、警告が生成され、キーフレーズは抽出されません。テキストが空の場合は、警告が生成されます。テキストが 50,000 文字を超える場合は、最初の 50,000 文字のみが分析され、警告が発行されます。

次の方法で共有

キーフレーズ抽出コグニティブスキル

@odata.type

データ制限

スキルのパラメーター

スキルの入力

スキルの出力

定義例

サンプル出力

document/myKeyPhrases

Warnings

関連項目

フィードバック

その他のリソース

次の方法で共有

キー フレーズ抽出コグニティブ スキル

@odata.type

データ制限

スキルのパラメーター

スキルの入力

スキルの出力

定義例

サンプル出力

document/myKeyPhrases

Warnings

関連項目

フィードバック

その他のリソース

キーフレーズ抽出コグニティブスキル