[用語抽出変換エディター] ( タブ)

[用語抽出変換エディター] ダイアログ ボックスの [詳細設定] タブを使用すると、頻度、長さ、語または句の抽出など、抽出に関するプロパティを指定できます。

用語抽出変換の詳細については、「用語抽出変換」を参照してください。

オプション

  • [名詞]
    変換によって個別の名詞のみを抽出するように指定します。

  • [名詞句]
    変換によって個別の名詞句のみを抽出するように指定します。

  • [名詞と名詞句]
    変換によって名詞と名詞句を両方とも抽出するように指定します。

  • [頻度]
    スコアが用語の頻度であることを指定します。

  • [TFIDF]
    スコアが用語の TFIDF 値であることを指定します。 TFIDF スコアは、Term Frequency と Inverse Document Frequency の積です。TFIDF of a Term T = (frequency of T) * log( (#rows in Input) / (#rows having T) ) として定義されます。

  • [頻度のしきい値]
    語または句を抽出する前の語または句の出現回数を指定します。 既定値は 2 です。

  • [用語の最大長]
    句の最大長を語数で指定します。 このオプションは、名詞句のみに影響を与えます。 既定値は 12 です。

  • [用語抽出で大文字と小文字を区別する]
    抽出で大文字と小文字を区別するかどうかを指定します。 既定値は False です。

  • [エラー出力の構成]
    [エラー出力の構成] ダイアログ ボックスを使用すると、エラーが発生した行に対するエラー処理を指定できます。

関連項目

参照

[用語抽出変換エディター] ([用語抽出] タブ)

[用語抽出変換エディター] ([除外] タブ)

概念

Integration Services のエラーおよびメッセージのリファレンス

用語参照変換