コンテンツ ソースについて (Office SharePoint Server)

コンテンツとは、Web ページ、Microsoft Office Word 文書、ビジネス データ、電子メールのメッセージなど、すべてのクロール可能なアイテムです。コンテンツは、Web サイト、ファイル共有、または SharePoint サイトなどのコンテンツ リポジトリに存在します。コンテンツ ソースは、コンテンツのクロール方法およびコンテンツのクロール スケジュールを定義する設定を指定します。コンテンツ ソースは、クロールを開始するコンテンツ リポジトリのアドレス (開始アドレスと呼ばれます) を 1 つ以上を含みます。これらの設定は、コンテンツ ソース全体のすべての開始アドレスに適用されます。

既定のコンテンツ ソース

SharePoint サイトに含まれるコンテンツのみをクロールする必要がある組織では、追加のコンテンツ ソースを作成する必要はありません。Microsoft Office SharePoint Server 2007 は、初期展開中に既定のコンテンツ ソースを定義します。既定のコンテンツ ソースの名前は、"ローカルの Office SharePoint Server サイト" です。サーバー ファーム内のすべての Web アプリケーションの開始アドレスは、既定のコンテンツ ソースの一部として自動的に含まれます。このコンテンツ ソースは既定ではクロールされません。既定のコンテンツ ソース内のコンテンツのインデックスを作成するには、クロールを手動で開始するか、クロールを行うスケジュールを作成します。

新しいコンテンツ ソースを作成する

コンテンツがクロールされるときのクロールするコンテンツの種類、およびクロールの動作 (開始アドレスの名前空間内をクロールする深さや、許可するサーバー ホップ数など) を定義する設定を、コンテンツ ソースを作成するときに指定します。複数の種類のコンテンツ リポジトリをクロールする場合や、別のスケジュールでクロールするコンテンツ リポジトリがある場合は、追加のコンテンツ ソースを作成する必要があります。Office SharePoint Server 2007 は、共有サービス プロバイダ (SSP) ごとに最大 500 個のコンテンツ ソースをサポートでき、各コンテンツ ソースは最大 500 個の開始アドレスを含むことができます。追加のコンテンツ ソースを作成するタイミングの詳細については、「コンテンツのクロールを計画する (Office SharePoint Server)」の「コンテンツ ソースを計画する」セクションを参照してください。クロールの動作を構成する方法の詳細については、「クロールされるコンテンツの量を制限または増加する (Office SharePoint Server)」を参照してください。

コンテンツ リポジトリの種類

クロールできるコンテンツの種類は、コンテンツ ソースごとに 1 種類のコンテンツ リポジトリのみです。つまり、SharePoint サイトの URL を含むコンテンツ ソースと、ファイル共有の URL を含む別のコンテンツ ソースを作成できますが、SharePoint サイトとファイル共有の両方の URL を含む単一のコンテンツ ソースを作成することはできません。

以下の表に、Office SharePoint Server 2007 がクロールできるコンテンツ リポジトリの種類の一覧を示します。

コンテンツ ソースの種類 含まれるコンテンツの種類

SharePoint サイト

  • 同じファームまたは別の Microsoft Office SharePoint Server 2007 ファーム、Windows SharePoint Services 3.0 ファーム、あるいは Microsoft Search Server 2008 ファームの SharePoint サイト

  • Microsoft Office SharePoint Portal Server 2003 ファームまたは Microsoft Windows SharePoint Services 2.0 ファームの SharePoint サイト

    Note メモ
    Office SharePoint Server 2007 のクローラは、Office SharePoint Server 2007、Windows SharePoint Services 3.0、および Search Server 2008 のサイトとサブサイトのすべてを自動的にクロールできます。以前のバージョンの SharePoint 製品とテクノロジをクロールするには、クロールする各トップレベル サイト (サイト コレクション) と各サブサイトの URL を指定する必要があります。 Microsoft Office SharePoint Portal Server 2003 ファームのサイト ディレクトリで指定されたサイトは、ポータル サイトのクロール時にクロールされます。サイト ディレクトリの詳細については、「About the Site Directory (英語)」(https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x411) を参照してください。

Web サイト

  • SharePoint サイトにはない組織内の Web コンテンツ

  • インターネット上の Web サイトのコンテンツ

    Note メモ
    クローラは、Web サイトや SharePoint サイトのコンテンツの種類を使用するときと同様に動作します。 異なるのは、これらのコンテンツ ソースの種類に対して構成できるクロール設定のみです。

ファイル共有

  • 組織内のファイル共有のコンテンツ

Exchange パブリック フォルダ

  • Microsoft Exchange Server コンテンツ

Lotus Notes

  • Lotus Notes データベースに保存されているコンテンツ

    Note メモ
    Lotus Notes コンテンツ ソースのオプションは、Lotus Notes が動作するインデックス サーバーを構成するまで、ユーザー インターフェイスに表示されません。詳細については、「Lotus Notes のクロールを準備する (Office SharePoint Server 2007)」を参照してください。

ビジネス データ (Enterprise Edition のみ)

  • 基幹業務アプリケーションに格納されたビジネス データ

    ビジネス データ カタログに登録されているすべてのアプリケーションをクロールするためのコンテンツ ソースを 1 つ作成するか、ビジネス データ カタログに登録されている個々のアプリケーションをクロールするための個別のコンテンツ ソースを作成することができます。

    ビジネス データのコンテンツ ソースを作成する前に、データをホストするアプリケーションをビジネス データ カタログに登録する必要があります。詳細については、「ビジネス データ カタログにビジネス アプリケーションを登録する」を参照してください。

コンテンツの開始アドレス

各コンテンツ ソースは、クローラがコンテンツのリポジトリへの接続に使用する開始アドレスのリストを含みます。各コンテンツ ソースは最大 500 個の開始アドレスを含むことができます。複数のコンテンツ ソースを使用して同じアドレスをクロールすることはできません。たとえば、特定のコンテンツ ソースを使用してサイト コレクションとそのすべてのサブサイトをクロールする場合は、異なるコンテンツ ソースを使用してそれらのサブサイトの 1 つを別のスケジュールでクロールすることはできません。

コンテンツのクロール

コンテンツ ソースを使用して、手動でクロールを開始したり、選択したコンテンツ ソースをクロールするタイミングと頻度をスケジュールできます。コンテンツ ソースの一部のコンテンツを異なるスケジュールでクロールする場合は、そのコンテンツのために個別のコンテンツ ソースを作成する必要があります。パフォーマンスと管理性の理由から、使用するコンテンツ ソースを可能な限り少数にすることをお勧めします。 手動でクロールを開始する方法やクロールをスケジュールする方法の詳細については、 「コンテンツをクロールする (Office SharePoint Server 2007)」を参照してください。

認証

コンテンツ ソースに指定されている開始アドレスにクローラがアクセスするとき、クローラはそのコンテンツをホストするサーバーの認証を受け、アクセスの許可を受ける必要があります。 クローラによって使用されるユーザー アカウントには、最低でもコンテンツをクロールする読み取りアクセス許可が必要です。既定では、Office SharePoint Server 2007 は、既定のコンテンツ アクセス アカウントを使用し、サーバーの認証には NTLM を使用します。詳細については、「クローラの認証方法を構成する (Office SharePoint Server 2007)」を参照してください。

関連項目

概念

コンテンツのクロールを計画する (Office SharePoint Server)
ブログ投稿の内容を返すように検索を構成する (Office SharePoint Server 2007)
SSL サイトをクロールするためのクライアント証明書を構成する (Office SharePoint Server 2007)