クロール ルールを使用してクロールするコンテンツを決定する (Search Server 2008)

更新日: 2009年8月

適用対象: Microsoft Search Server 2008

 

トピックの最終更新日: 2009-08-10

注意

別途記載のない限り、この記事の情報は Microsoft Search Server 2008 と Microsoft Search Server 2008 Express の両方に適用されます。

この記事の内容 :

  • クロール ルールを作成する

  • クロール ルールを編集する

  • クロール ルールを削除する

  • クロール ルールを並べ替える

この手順を実行する前に、次のことを確認してください。

重要

この記事に記載されている手順を完了するには、検索サービス管理者であることが必要です。詳細については、「検索サービス管理者を追加または削除する (Search Server 2008)」を参照してください。

新しいクロール ルールを作成するか、既存のクロール ルールを編集して、クロールするコンテンツを決定できます。また、クロール ルールを並べ替えて、これらのルールを適用する順序を指定することもできます。

クロール ルールを作成する

クロール ルールを作成するには、次の手順を実行します。

クロール ルールを作成する

  1. [検索管理] ページの [クロール中] セクションで、[クロール ルール] をクリックします。

  2. [クロール ルールの管理] ページの [新しいクロール ルール] をクリックします。

  3. [クロール ルールの追加] ページの [パス] セクションで、[パス] ボックスにこのルールの影響を受けるパスを入力します。このパスでは、標準のワイルドカード文字を使用できます。たとえば、次のように入力します。

    • http://server1/folder* には、http://server1/folder で始まる URL のすべての Web リソースが含まれます。

    • *://*.txt には、txt ファイル拡張子を持つすべてのドキュメントが含まれます。

  4. [クロールの構成] セクションで、以下のどちらかを選択します。

    • [このパスにあるアイテムをすべて除外する]。指定したパスにあるすべてのアイテムをクロールから除外する場合は、このオプションを選択します。

    • [このパスにあるアイテムをすべて含める]。パスにあるすべてのアイテムをクロールする場合は、このオプションを選択します。

  5. このパスにあるアイテムをすべて除外する場合は、手順 7. に進みます。それ以外の場合は、以下を自由に組み合わせて選択して、含めるアイテムをさらに詳細に指定できます。

    • [URL 自体をクロールしないで URL のリンクをたどる]。URL 自体をクロールせずに、URL に含まれるリンクをクロールする場合は、このオプションを選択します。

    • [複合 URL (疑問符 (?) が含まれる URL) をクロールする]。疑問符 (?) を使用したパラメータが含まれている URL をクロールする場合は、このオプションを選択します。

    • [SharePoint のコンテンツを HTTP ページとしてクロールする]。通常、SharePoint のコンテンツは特殊なプロトコルを使用してクロールされます。その代わりに SharePoint のコンテンツを HTTP ページとしてクロールする場合は、このオプションを選択します。HTTP プロトコルを使用してコンテンツをクロールすると、アイテムの権限は保存されません。つまり、クエリを開始したユーザーがこれらのアイテムに対するアクセス権を持っているかどうかに関係なく、特定の検索クエリに一致するすべてのアイテムが検索結果ページに表示されます。

      この設定の目的は、検索管理者がリモートの SharePoint サイトを明示的に制御できないために、これらのリモート サイトのクロールに使用するドメイン アカウントに対して、これらのサイトのすべての読み取りアクセス権を付与できない場合に、リモートの SharePoint サイトをクロールできるようにすることにあります。

    注意

    [認証の指定] セクションの設定の詳細については、「クロール ルールを使用して別のコンテンツ アクセス アカウントまたは認証方法を指定する (Search Server 2008)」を参照してください。

  6. [OK] をクリックします。

  7. 作成する新しいクロール ルールごとに手順 2. ~ 5. を繰り返します。

クロール ルールを編集する

既存のクロール ルールは、該当するルールクリックし、前の手順で説明した方法でパスおよび構成に必要な変更を加えることで、いつでも編集できます。

注意

この場合、変更したクロール ルールの影響を受けるコンテンツのフル クロールが必要になります。

クロール ルールを削除する

不要になったクロール ルールを削除するには、次の手順を実行します。

クロール ルールを削除する

  1. [共有サービス管理] ページの [検索] セクションで、[検索の設定] をクリックします。

  2. [検索設定の構成] ページの [クロール設定] セクションで、[クロール ルール] をクリックします。

  3. [クロール ルールの管理] ページで、削除するクロール ルールをポイントし、矢印をクリックしたときに表示されるメニューで [削除] をクリックします。

  4. [OK] をクリックし、削除を確認します。

注意

この場合、削除したクロール ルールの影響を受けるコンテンツのフル クロールが必要になります。

クロール ルールを並べ替える

新しいクロール ルールを作成したら、コンテンツのクロール時に適用するルールの順序を指定することをお勧めします。クロール ルールは、一覧に表示されている順序どおりに適用されます。したがって、同じコンテンツまたは重複するコンテンツを対象とするルールが 2 つ存在する場合は、一覧にある最初のルールが適用されます。クロール ルールの順序を指定するには、次の手順を実行します。

クロール ルールを並べ替える

  • [共有サービス管理] ページの [検索] セクションで、[検索の設定] をクリックします。

  • [検索設定の構成] ページの [クロール設定] セクションで、[クロール ルール] をクリックします。

  • [クロール ルールの管理] ページにあるクロール ルールの一覧の [順序] 列で、一覧から値を選択してルールの順序を指定します。その他の値は順に 1 つずつずれます。

    一覧に表示されている順序に関係なく適用されるグローバルな除外ルールを使用することもできます。クロール ルールの管理の詳細については、「Book Excerpt - Chapter 16 Enterprise search and indexing architecture and administration」 (英語)の「Administrating Crawl Rules」を参照してください。

注意

この場合、並べ替えたクロール ルールの影響を受けるコンテンツのフル クロールが必要になります。