ワード ブレーカとステミング機能

ワード ブレーカとステミング機能は、すべてのフルテキスト インデックス データに対して言語分析を実行します。言語分析には、単語の境界 (単語の区切り) の検索と動詞の活用 (ステミング) が含まれます。この分析の規則は言語によって異なり、フルテキスト インデックス列ごとに言語を指定できます。各言語用にワード ブレーカを用意することで、その言語に対する検索結果の精度が高くなります。言語ファミリにはワード ブレーカが存在していても、特定のサブ言語は対象とされない場合は、主言語が使用されます。たとえば、カナダ系フランス語テキストの処理には、フランス語のワード ブレーカが使用されます。特定の言語用のワード ブレーカが使用できない場合は、ニュートラル ワード ブレーカが使用されます。ニュートラル ワード ブレーカを使用すると、単語は空白や句読点などのニュートラル文字で分割されます。

Microsoft SQL Server 2005 には、23 のロケール用のワード ブレーカが含まれています。フルテキスト検索でサポートされている言語の一覧については、「sys.fulltext_languages (Transact-SQL)」を参照してください。

クエリ対象のフルテキスト インデックス列の言語によって、フルテキスト クエリ関数である CONTAINS、FREETEXT、CONTAINSTABLE、および FREETEXTTABLE の引数で実行される言語分析が決まります。列に言語が指定されていない場合、既定では構成オプション default full-text language の値になります。

SQL Server のローカライズされたバージョンでは、適切な言語が存在する場合は SQL Server セットアップによって、default full-text language オプションはサーバーの言語に設定されます。SQL Server のローカライズされていないバージョンでは、default full-text language オプションは英語になります。

ms142509.note(ja-jp,SQL.90).gifメモ :
1 つのフルテキスト クエリ関数句に指定されるすべての列は、クエリで LANGUAGE オプションが指定されていない限り、同じ言語を使用する必要があります。

参照

概念

フルテキスト検索の基礎

その他の技術情報

default full-text language オプション

ヘルプおよび情報

SQL Server 2005 の参考資料の入手