類義語辞典ファイルを編集する方法 (フルテキスト検索)

特定の言語の類義語辞典は、類義語辞典ファイル (XML ファイル) を編集することによって構成できます。セットアップ中に、<xml> コンテナーおよびコメント アウトされたサンプルの <thesaurus> 要素のみが格納されている空の類義語辞典ファイルがインストールされます。シノニムを検索するフルテキスト検索クエリを正しく機能させるには、一連のシノニムを定義する実際の <thesaurus> 要素を作成する必要があります。シノニムの定義には、拡張セットと置換セットという 2 つの形式があります。類義語辞典ファイルの場所と構造の詳細については、「類義語辞典の構成」を参照してください。

類義語辞典ファイルの制限

類義語辞典ファイルの編集には、次の制限が適用されます。

  • 類義語辞典ファイルを更新、変更、または削除できるのはシステム管理者だけです。

  • テキスト エディター ツールを使用して類義語辞典ファイルを編集する場合、ファイルが Unicode 形式で保存され、バイト順マークが指定されている必要があります。

  • 類義語辞典のエントリを空にしたり、空の文字列の単語に区切ったりすることはできません。

  • 類義語辞典ファイルの語句は 512 文字以下にする必要があります。

  • 類義語辞典には、拡張セットの <sub> エントリおよび置換セットの <pat> 要素間で重複したエントリを含めることはできません。

類義語辞典ファイルに関する推奨事項

類義語辞典ファイル内のエントリには特殊文字を含めないことをお勧めします。これは、特殊文字に対するワード ブレーカーの動作がわかりづらいためです。類義語辞典のエントリに特殊文字が含まれる場合、そのエントリと組み合わせて使用されるワード ブレーカーの動作がフルテキスト クエリに与える影響がわかりづらくなる可能性があります。

ストップ ワードはフルテキスト インデックスから省略されるので、<sub> エントリにはストップ ワードを含めないことをお勧めします。クエリは類義語辞典ファイルの <sub> エントリを含むように拡張されるので、<sub> エントリにストップ ワードが含まれる場合は、クエリのサイズが不必要に大きくなります。

類義語辞典ファイルを編集するには

  1. 類義語辞典ファイルをメモ帳で開きます。

  2. 初めて類義語辞典ファイルを編集する場合は、ファイルの先頭と末尾の次のコメント行をそれぞれ削除します。

    <!--Commented out
    -->
    
  3. 置換セットまたは拡張セットを追加、変更、または削除します。詳細については、「類義語辞典の構成」を参照してください。

  4. ファイルを保存し、メモ帳を閉じます。

  5. 類義語辞典ファイルの内容を tempdb に読み込むために sp_fulltext_load_thesaurus_file を使用し、類義語辞典ファイルの言語に対応するロケール識別子 (LCID) を指定します。たとえば、英語の類義語辞典ファイル tsenu.xml の場合、対応する LCID は 1033 です。

    USE AdventureWorks2008R2 ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO