IFilters とプロトコル ハンドラ (Search Server 2008)

更新日: 2009年4月

適用対象: Microsoft Search Server 2008

 

トピックの最終更新日: 2009-03-13

注意

別途記載のない限り、この記事の情報は Microsoft Search Server 2008 と Microsoft Search Server 2008 Express の両方に適用されます。

Search Server 2008 のクローラは、プロトコル ハンドラを使用してコンテンツにアクセスした後、IFilter を使用してクロールするファイルからコンテンツを抽出します。IFilter は、エンジンがドキュメントのコンテンツのインデックスを作成する前に、アプリケーション固有のフォーマットを削除します。プロトコル ハンドラと IFilter がインストールされているファイル タイプのみ、Search Server によってクロールされます。

このセクションでは、既定で Search Server インストールに含まれる IFilter とプロトコル ハンドラについて、また、追加の IFilter とプロトコル ハンドラのインストールおよび登録を行う方法について説明します。

クローラは、プロトコル ハンドラと IFilter を次のように使用します。

  1. クローラはコンテンツ ソースの開始アドレスを取得し、URL のプレフィックスに基づいてプロトコル ハンドラを呼び出します。

  2. プロトコル ハンドラはコンテンツ ソースに接続し、システム レベルのメタデータとアクセス制御リストの情報を抽出します。

  3. プロトコル ハンドラは、ファイル名拡張子に基づいて各コンテンツ項目のファイル タイプを特定し、そのファイル タイプに関係付けられた適切な IFilter を呼び出します。

  4. IFilter はコンテンツを抽出し、設定された書式があればそれを解除して、コンテンツ項目のメタデータを取得します。

  5. コンテンツは対応する言語用の 1 つ以上のワード ブレーカによって解析され、フルテキスト インデックス (コンテンツ インデックスとも呼ばれます) に追加されます。メタデータとアクセス制御リストが検索データベースに追加されます。

このセクションの内容 :

関連項目

概念

コンテンツ ソースを追加する (Search Server 2008)