[用語抽出変換エディター] ( タブ)
[用語抽出変換エディター] ダイアログ ボックスの [詳細設定] タブを使用すると、頻度、長さ、語または句の抽出など、抽出に関するプロパティを指定できます。
用語抽出変換の詳細については、「用語抽出変換」を参照してください。
オプション
[名詞]
変換によって個別の名詞のみを抽出するように指定します。[名詞句]
変換によって個別の名詞句のみを抽出するように指定します。[名詞と名詞句]
変換によって名詞と名詞句を両方とも抽出するように指定します。[頻度]
スコアが用語の頻度であることを指定します。[TFIDF]
スコアが用語の TFIDF 値であることを指定します。 TFIDF スコアは、Term Frequency と Inverse Document Frequency の積です。TFIDF of a Term T = (frequency of T) * log( (#rows in Input) / (#rows having T) ) として定義されます。[頻度のしきい値]
語または句を抽出する前の語または句の出現回数を指定します。 既定値は 2 です。[用語の最大長]
句の最大長を語数で指定します。 このオプションは、名詞句のみに影響を与えます。 既定値は 12 です。[用語抽出で大文字と小文字を区別する]
抽出で大文字と小文字を区別するかどうかを指定します。 既定値は False です。[エラー出力の構成]
[エラー出力の構成] ダイアログ ボックスを使用すると、エラーが発生した行に対するエラー処理を指定できます。