SharePoint Server でクロール ルールを管理する
適用対象:2016 2019 Subscription Edition SharePoint in Microsoft 365
クロール ルールを追加することで、コンテンツをクロールするときに特定のパスを含めたり、除外したりできます。 パスを含める場合は、クロール用の代替アカウント資格情報を指定できます。 クロール ルールの作成や編集のほかに、既存のクロール ルールをテスト、編集、削除したり、並べ替えたりすることができます。
クロール ルールを使用して、以下のことを行います。
サイト上のコンテンツがクロールされないようにします。 たとえば、 "http://www.contoso.com" をクロールするコンテンツ ソースを作成したが、検索システムがサブディレクトリ 'http://www.contoso.com/downloads' からコンテンツをクロールしないようにする場合は、そのサブディレクトリからコンテンツを除外するクロール ルールを作成します。
それ以外の場合は除外されるサイトのコンテンツをクロールします。 たとえば、 コンテンツを 'http://www.contoso.com/downloads' からクロールから除外したが、サブディレクトリ 'http://www.contoso.com/downloads/content' のコンテンツをクロールする場合は、そのサブディレクトリのコンテンツを含めるクロール ルールを作成します。
認証資格情報を指定する。 クロール対象のサイトで、既定のコンテンツ アクセス アカウントの資格情報とは異なる資格情報を必要とする場合は、認証用の資格情報を指定するクロール ルールを作成します。
クロール ルールでは、アスタリスク (*) をワイルドカード文字として使用できます。 たとえば、 "http://www.contoso.com" のクロールから JPEG ファイルを除外するには、 'http://www.contoso.com/*.jpg' を除外するクロール ルールを作成します。
クロール ルールの順序は重要です。これは、特定のコンテンツ セットと一致する最初のルールが適用されるからです。
クロール ルールを作成または編集するには
この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。
サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。
[サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。
[検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。 [クロール ルールの管理] ページが表示されます。
新しいクロール ルールを作成するには、[新しいクロール ルール] をクリックします。 既存のクロール ルールを編集するには、クロール ルールの一覧で、編集するクロール ルールの名前をポイントし、表示される矢印をクリックして、[ 編集] をクリックします。
[クロール ルールの追加] ページの [ パス] セクションで、次の操作を行います。
[ パス] ボックスに、クロール ルールを適用するパスを入力します。 このパスでは、標準のワイルドカード文字を使用できます。
ワイルドカード文字ではなく正規表現を使用するには、[ このルールのマッチングに正規表現構文を使用する] を選択します。
- [ クロールの構成] セクションで、次のいずれかのオプションを選択します。
[このパスにあるアイテムをすべて除外する]。 指定したパスにあるすべてのアイテムをクロールから除外する場合は、このオプションを選択します。 このオプションを選択した場合は、[ 除外する複雑な URL (疑問符を含む URL (?)] を選択して、疑問符 (?) 表記を使用するパラメーターを含む URL を除外することで除外を絞り込むことができます。
[このパスにあるアイテムをすべて含める]。 パスにあるすべてのアイテムをクロールする場合は、このオプションを選択します。 このオプションを選択した場合は、次のオプションの任意の組み合わせを選択することで、包含をさらに絞り込むことができます。
[URL 自体をクロールしないで URL のリンクをたどる]。 開始 URL 自体をクロールせずに、URL に含まれるリンクをクロールする場合は、このオプションを選択します。
[複合 URL (疑問符 (?) が含まれる URL) をクロールする]。 疑問符 (?) の表記を使用するパラメータが含まれている URL をクロールする場合は、このオプションを選択します。
SharePoint Server コンテンツを http ページとしてクロールします。 通常、SharePoint Server サイトは特別なプロトコルを使用してクロールされます。 代わりに SharePoint Server サイトを HTTP ページとしてクロールする場合は、このオプションを選択します。 HTTP プロトコルを使用してコンテンツをクロールすると、アイテムの権限は保存されません。
[ 認証の指定] セクションで、以下のいずれかの操作を行います。
注:
このオプションは、[ クロールの構成] セクションで [ このパスにあるアイテムをすべて含める] オプションを選択した場合にのみ使用できます。
既定のコンテンツ アクセス アカウントを使用するには、[ 既定のコンテンツ アクセス アカウントを使用] を選択します。
別のアカウントを使用する場合は、[ 別のコンテンツ アクセス アカウントを指定 する] を選択し、[ アカウント ] ボックスに、このクロール ルールで定義されているパスにアクセスできるユーザー アカウント名を入力します。 次に、[ パスワード ] ボックスと [ パスワードの確認 ] ボックスに、このユーザー アカウントのパスワードを入力します。 基本認証の使用を回避するには、[ 基本認証を許可しない] チェック ボックスをオンにします。 サーバーは、NTLM 認証の使用を試みます。 NTLM 認証に失敗した場合、[ 基本認証を使用しない] チェック ボックスがオンでない限り、サーバーは基本認証の使用を試みます。
認証にクライアント証明書を使用する場合は、[ クライアント証明書を指定する] を選択し、[ 証明書] メニューを展開してから証明書を選択します。
フォーム資格情報を認証に使用するには、[ フォーム資格情報を指定する] を選択し、[ フォームの URL] ボックスに、フォームの URL (資格情報を受け取るページの場所) を入力してから [ 資格情報の入力] をクリックします。 リモート サーバーのログオン プロンプトが新しいウィンドウに表示されたら、ログオンに使用するフォーム資格情報を入力します。 ログオンに成功した場合、プロンプトが表示されます。 ログオンに成功すると、認証に必要な資格情報がリモート サイトに保存されます。
Cookie を使用するには、[ クロールに Cookie を使用する] を選択し、[ URL から Cookie を取得 する] を選択して、Web サイトまたはサーバーから Cookie を取得します。 または、[ クロール用の Cookie の指定] を選択して、ローカル ファイル システムまたはファイル共有から Cookie をインポートします。 必要に応じて、エラー ページを [ エラー ページ (セミコロン区切り)] ボックスに指定することもできます。
匿名アクセスを許可するには、[ 匿名アクセス] を選択します。
- [OK] をクリックします。
クロール ルールを URL に対してテストするには
この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。
サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。
[サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。
[検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。
[クロール ルールの管理] ページで、[ URL を入力してテストをクリックし、ルールに一致するかどうかを確認します] ボックスに、テストする URL を入力します。
[ テスト] をクリックします。 テストの結果は、[URL を入力してテストをクリックし、ルールに一致するかどうかを確認します] ボックスの下に表示されます。
クロール ルールを削除するには
この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。
サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。
[サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。
[検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。
[クロール ルールの管理] ページで、削除するクロール ルールの名前をクロール ルール リストでポイントし、表示された矢印をクリックします。次に、[ 削除] をクリックします。
[OK] をクリックして、このクロール ルールの削除を確認します。
クロール ルールを並べ替えるには
この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。
サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。
[サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。
[検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。
[クロール ルールの管理] ページにあるクロール ルール リストの [ 順序] 列で、クロール ルールを適用する位置を指定します。 その他の値は順に 1 つずつずれます。