ノイズ ワード ファイルの編集 (Office SharePoint Server)

ノイズ ワードは、"the"、"an" など、検索に必要のない単語です。ノイズ ワード ファイルは、"ストップ ワード" ファイルと呼ばれることもあります。このファイルには、ユーザーが検索を実行する際に除外または無視される単語のリストが含まれています。このリストには、接続詞、冠詞、形容詞、副詞など、検索に無関係な単語と共に、普通名詞、不快な言葉、および不適切な言葉が含まれていることがあります。

この記事の内容

  • ノイズ ワード ファイルについて

  • ノイズ ワード ファイルを編集する

  • 言語別ノイズ ワード ファイルのリスト

ノイズ ワード ファイルについて

ノイズ ワードのリストは、言語別のノイズ ワード ファイルに保存されています。ある言語のノイズ ワード リストがない場合、Microsoft Office SharePoint Server 2007 ではニュートラルなノイズ ワード ファイル (noiseneu.txt) が使用されます。特定の言語のワード ブレーカは、言語の語彙規則に基づいて単語境界が存在する箇所を決定することにより、個々の単語を識別します。インデックス作成時またはクエリ時に、特定言語のワード ブレーカによって単語が検出された場合、ノイズ ワード ファイルにリストされている単語は削除されます。ノイズ ワード ファイルでサポートされている言語の詳細については、「言語別ノイズ ワード ファイルのリスト」のセクションを参照してください。

既定では、ノイズ ワード ファイルは、クエリ サーバー上の Drive:\Program Files\Microsoft Office Servers\12.0\Data\Config に作成され、格納されます。ノイズ ワード ファイルは、この既定の場所からクエリ サーバー上にある Microsoft Search サービスの各インスタンスの Drive:\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<Application UID>\Config というフォルダの場所にコピーされます。ここで、<Application UID> は、Search サービスの各インスタンスに関連付けられた GUID です。

注意

既定の場所にあるノイズ ワード ファイルを変更すると、新しい共有サービス プロバイダ (SSP) が作成されるたびに、変更済みのファイルが自動的にコピーされます。SSP の作成後に既定の場所のノイズ ワード ファイルを変更した場合は、既定の場所から、既に存在している SSP の指定のディレクトリにファイルをコピーする必要があります。

ノイズ ワードを追加すると、検索の精度が低下することがあります。ただし、コンテンツ インデックスのサイズも小さくなり、パフォーマンスが向上します。検索でノイズ ワードを返すようにするには、そのノイズ ワードを削除します。

ノイズ ワード ファイルから単語を削除しても、コンテンツ インデックスをリセットし、削除したキーワードを含むすべてのコンテンツのフル クロールを実行しない限り、ノイズ ワード ファイルへの変更は反映されません。ノイズ ワード ファイルに単語を追加した場合、その単語は検索対象から外れるため、すべてのコンテンツのフル クロールを実行する必要はありません。ただし、インデックスのサイズは、フル クロールを実行するまで小さくなりません。

ノイズ ワード ファイルは削除しないでください。更新またはクエリ時にノイズ ワードを除外しない場合は、そのエントリをファイルから削除します。ノイズ ワード ファイルを削除すると、すべての単一文字がノイズ ワードとして除外されます。

ノイズ ワード ファイルを編集する

ノイズ ワード ファイルを編集するには、次の手順に従います。

ノイズ ワード ファイルを編集する

  1. メモ帳を開いて、ノイズ ワード ファイルを開きます。適切なノイズ ワード ファイルを検索および識別する方法については、「ノイズ ワード ファイルについて」のセクションを参照してください。

  2. 検索クエリで無視する単語のみが含まれるように、リストを編集します。

  3. ノイズ ワード ファイルを保存して、メモ帳を閉じます。

    注意

    変更済みのノイズ ワード ファイルを保存する場合は、常に既定のエンコード値を使用します。

  4. 次の手順に従って、Office SharePoint Server Search サービスを再起動します。

    1. [スタート] ボタンをクリックし、[管理ツール] をポイントします。次に、[サービス] をクリックします。

    2. [Office SharePoint Server Search] を右クリックし、[再起動] をクリックします。

  5. Search サービスで、変更済みのノイズ ワード ファイルを利用するには、コンテンツ ソースのフル クロールを開始します。フル クロールの開始方法については、「フル クロールを開始する (Office SharePoint Server 2007)」を参照してください。

言語別ノイズ ワード ファイルのリスト

Office SharePoint Server 2007 には、次の言語のノイズ ワード ファイルが含まれています。

言語 ファイル名

アラビア語

noiseara.txt

ベンガル語

noiseben.txt

ブルガリア語

noisebul.txt

カタルニア語

noisecat.txt

簡体字中国語

noisechs.txt

繁体字中国語

noisecht.txt

クロアチア語

noisecro.txt

デンマーク語

noisedan.txt

オランダ語 (オランダ)

noisenld.txt

英語 (英国)

noiseeng.txt

英語 (米国)

noiseenu.txt

フィンランド語

noisefin.txt

フランス語

noisefra.txt

ドイツ語

noisedeu.txt

ギリシャ語

noisegrc.txt

グジャラート語

noiseguj.txt

ヘブライ語

noiseheb.txt

ヒンディー語

noisehin.txt

アイスランド語

noiseice.txt

インドネシア語

noiseind.txt

イタリア語

noiseita.txt

日本語

noisejpn.txt

カンナダ語

noisekan.txt

韓国語

noisekor.txt

ラトビア語

noiselat.txt

リトアニア語

noiselit.txt

マレー語

noisemal.txt

マラヤーラム語

noisemly.txt

マラーティー語

noisemar.txt

ニュートラル

noiseneu.txt

ノルウェー語 (ブークモール)

noisenor.txt

ポーランド語

noiseplk.txt

ポーランド語

noisepol.txt

ポルトガル語

noisepor.txt

ポルトガル語 (ブラジル)

noiseptb.txt

パンジャーブ語

noisepun.txt

ルーマニア語

noiserom.txt

ロシア語

noiserus.txt

セルビア語 (キリル)

noisesbc.txt

セルビア語 (ラテン)

noisesbl.txt

スロバキア語

noisesvk.txt

スロベニア語

noiseslo.txt

スペイン語

noiseesn.txt

スウェーデン語

noisesve.txt

タミール語

noisetam.txt

テルグ語

noisetel.txt

タイ語

noisetha.txt

トルコ語

noisetur.txt

ウクライナ語

noiseurk.txt

ウルドゥー語 (パキスタン)

noiseurd.txt