ノイズ語

フルテキスト インデックスが肥大化するのを防ぐため、Microsoft SQL Server には頻繁に出現する、検索に役立たない語を破棄するメカニズムがあります。このような語をノイズ語 (ストップ ワード) といいます。ノイズ語は、ロケール固有のノイズ語ファイルに列挙されています。たとえば、英語ロケールでは、"a"、"and"、"is"、"the" などの語は検索に役立たないことが経験的に知られているため、英語のノイズ語ファイルに入れられ、フルテキスト インデックスから除外されます。ただし、フルテキスト インデックスではノイズ語の位置が考慮されます。たとえば、"Instructions are applicable to these Adventure Works Cycles models" という句があるとします。以下のテーブルは、句の中の語の位置を表しています。

語またはトークン 位置

Instructions

1

are

2

applicable

3

to

4

these

5

Adventure

6

Works

7

Cycles

8

models

9

位置 2、4、および 5 にあるノイズ語 "are"、"to"、"these" は、フルテキスト インデックスから除外されます。ただし、その位置情報は保持されるため、語句内の他の語の位置は変わりません。

ノイズ語ファイルは、$SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\ ディレクトリに格納されます。このディレクトリの作成、およびノイズ語ファイルのインストールは、SQL Server のセットアップ時にフルテキスト検索のサポートを含めると実行されます。ノイズ語ファイルは編集できるので、たとえば、ハイテク企業のシステム管理者はノイズ語の一覧に「コンピュータ」という語を追加できます。

ms142551.note(ja-jp,SQL.90).gif重要 :
ノイズ語ファイルを編集した場合、変更を有効にするには、フルテキスト カタログを再作成する必要があります。

次の表は、ノイズ語ファイルとそれぞれの言語を示します。

ノイズ語ファイル 言語

Noisechs

簡体字中国語

Noisecht

繁体字中国語

Noisedan

デンマーク語

Noisedeu

ドイツ語

Noiseeng

英語 (UK)

Noiseenu

英語 (US)

Noiseesn

スペイン語

Noisefra

フランス語

Noiseita

イタリア語

Noisejpn

日本語

Noisekor

韓国語

Noiseneu

ニュートラル言語

Noisenld

オランダ語

Noiseplk

ポーランド語

Noiseptb

ポルトガル語 (ブラジル)

Noisepts

ポルトガル語 (ポルトガル)

Noiserus

ロシア語

Noisesve

スウェーデン語

Noisetha

タイ語

Noisetrk

トルコ語

参照

概念

フルテキスト検索の基礎

ヘルプおよび情報

SQL Server 2005 の参考資料の入手