クローラ影響ルールを追加する (Search Server 2008)

更新日: 2008年9月

適用対象: Microsoft Search Server 2008

 

トピックの最終更新日: 2015-03-09

この記事では、サイトをクロールするためのクローラ影響ルールを追加する方法について説明します。クローラ影響ルールを使用することの重要性については、「クローラの影響を管理する (Search Server 2008)」を参照してください。

注意

別途記載のない限り、この記事の情報は Microsoft Search Server 2008 と Microsoft Search Server 2008 Express の両方に適用されます。

クローラ影響ルールを追加するときは、指定したサイトのクロールに関する以下のどちらかの制限を指定します。

  • クローラがサイトから一度に要求できるドキュメントの最大数。

  • クローラがサイトからドキュメントを要求できる頻度。

この記事の内容 :

  • クローラ影響ルールを追加する

  • サイト名でワイルドカード文字を使用する

クローラ影響ルールを追加する

クローラ影響ルールを追加するには、次の手順を実行します。

重要

この手順を実行するには、Search サービス管理者である必要があります。詳細については、「検索サービス管理者を追加または削除する (Search Server 2008)」を参照してください。

クローラ影響ルールを追加するには

  1. [検索管理] ページの [クロール中] セクションで、[クローラ影響ルール] をクリックします。

  2. [クローラ影響ルール] ページの [ルールの追加] をクリックします。

  3. [クローラ影響ルールの追加] ページの [サイト] セクションの [サイト] ボックスに、このクローラ影響ルールに関連付けるサイトを入力します。サイト名でのワイルドカード文字の使用については、「サイト名でのワイルドカード文字の使用」を参照してください。

    注意

    サイト名を入力するときは、プロトコルを省略する必要があります。たとえば、http://file:// は含めません。

  4. [要求頻度] セクションで、以下のどちらかのオプションを選択します。

    • [指定した数のドキュメントを一度に要求し、次の要求まで待機しない]。[同時要求数] リストから、指定したサイトをクロールする際にクローラが一度に要求するドキュメントの最大数を選択します。

    • [1 度に 1 つのドキュメントを要求し、次の要求まで指定した時間待機する]。[待機時間 (秒数)] ボックスに、要求間の待機時間を秒単位で入力します。最小の時間は 1 秒で、最大の時間は 1,000 秒です。

  5. [OK] をクリックします。

サイト名でワイルドカード文字を使用する

クローラ影響ルールでは 1 つのサイトを指定できますが、ワイルドカード文字を使用して、ルールの適用対象となる複数のサイトを指定することもできます。以下の表に、クローラ影響ルールの追加時にサイト名で使用できるワイルドカード文字を示します。

使用するワイルドカード 目的

* (サイト名)

すべてのサイトにルールを適用します。

*.* (サイト名)

名前にドットを含むサイトにルールを適用します。

*.サイト名.com (サイト名)

サイト名.com ドメイン (*.adventure-works.com など) 内のすべてのサイトにルールを適用します。

*.トップレベル ドメイン名 (*.com または *.net など) (サイト名)

特定のトップレベル ドメイン名 (.com または .net など) で終わるすべてのサイトにルールを適用します。

?

サイト名内の 1 つの文字を表します。たとえば、*.adventure-works?.com は、ドメイン内の adventure-works1.com、adventure-works2.com といったサイトすべてに適用されます。

たとえば、アドレスが .com で終わるすべてのインターネット サイトに適用される、*.com のクローラ影響ルールを管理者が作成できます。ポータルの管理者が samples.microsoft.com のコンテンツ ソースを追加するとします。samples.microsoft.com について個別のクローラ影響ルールが存在しない限り、*.com のルールはこのサイトに適用されます。

関連項目

概念

クローラ影響ルールを編集する (Search Server 2008)