SharePoint Server の分析処理の概要

適用対象:yes-img-13 2013yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

ユーザーにとって最も役立ち、重要と思われるコンテンツを識別して、表示する目的で、SharePoint Serverの 分析処理コンポーネントは、コンテンツ自体と、ユーザーがそれに対してどのような操作をしたかの両方を分析します。 時間の経過に伴い検索関連性が自動的に向上するように、分析結果は、検索インデックス内のアイテムに追加されます。 結果はレポートでも使用され、検索管理者はどの手動手順によって検索システムを改善できるかを確認できます。

分析アーキテクチャ

分析アーキテクチャは、以下の主要部分から構成されます。

  • 分析処理コンポーネント は、分析ジョブを実行します。 詳細については、「 さまざまな分析」を参照してください。

  • 分析レポート データベース は、さまざまな分析から、使用イベントカウントのような、統計上の情報を保存します。 SharePoint Server は、このデータベース内の情報を使用して、検索管理者用の Excel レポートを作成します。 詳細については、「 利用状況分析」と「分析処理に基づくレポート」を参照してください。

  • リンク データベース は、検索とクロールしたドキュメントについての情報を保存します。 データは、このデータベース内のさまざまなサブ分析で処理されます。 詳細については、「検索分析」を参照してください。

さまざまな分析

分析処理コンポーネントは、主に検索分析利用状況分析の、2 つの種類を実行します。 検索分析は、検索インデックス内のコンテンツを分析し、利用状況分析は、ユーザー操作を分析します。

  • 検索分析は、クロールされ、検索インデックスに追加されたコンテンツを分析します。

  • 利用状況分析は、SharePoint Server サイトでの、クリックまたは表示したアイテムなどのユーザー操作、あるいは使用イベントを分析します。

検索分析

検索分析は、コンテンツがクロール、処理され、検索インデックスに保存される際に、コンテンツからリンクとアンカー テキストのような情報を抽出する一連の分析です。 抽出された情報は、検索結果のクリックについての情報と共に、リンク データベースに保存されます。 リンク データベース内の情報は、いくつかのサブ分析でさらに処理されます。

検索分析から得られた情報は、関連性と再現率を向上するのに役立つ情報により、検索インデックス内のアイテムを充実させる目的で使用されます、これらの情報は、レポート データベースに保存され、レポートに含まれます。

検索分析での分析

分析 説明
アンカー テキストの処理 アンカー テキスト処理は、アイテムがコンテンツ コーパス内でどのようにリンクされているかを分析します。 また、分析内のリンクに関連付けられたアンカー テキストが含まれます。 分析処理コンポーネントは、検索インデックス内のアイテムにランク ポイントを追加する目的で、分析結果を使用します。
クリック距離 クリック距離分析は、検索インデックス内の優先するページおよびアイテム間の、クリックの数を計算します。 権限のあるページには、最上位のサイト (たとえば、 https://www.contoso.comなど) や、重要と見なされるその他のページを指定できます。 権限のあるページは、サーバーの全体管理で定義できます。

分析処理コンポーネントは、検索インデックス内のアイテムにランク ポイントを追加する目的で、分析結果を使用します。
検索クリック 検索クリック分析は、検索結果でユーザーがどのアイテムをクリックするかについての情報を使用して、検索インデックス内でアイテムのレベルを下げるか上げるかします。 分析は、基準関連性と比較してアイテムの新しいランク付けを計算します。

クリック データは、リンク データベースに保存されます。
ソーシャル タグ ソーシャル タグ分析は、ソーシャル タグを分析します。ソーシャル タグとは、ユーザーに分かりやすい方法で情報を分類する目的で、コンテンツに適用できる語句やフレーズのことです。

SharePoint Serverでは、ソーシャル タグは、既定では、絞り込み、ランク付け、再現率には使用されません。 しかし、この分析からのソーシャル タグと情報を使用するカスタムの検索エクスペリエンスを作成できます。
ソーシャル距離 ソーシャル距離分析では、フォローユーザー機能を使用するユーザー間の関係が計算されます。 分析では、1 番目と 2 番目のレベルの [次の値] が計算されます。最初のレベルの [次の値] と [次のフォロー] の順に計算されます。

この情報は、ソーシャル距離に基づいて連絡先検索結果を並べ替える目的で使用されます。
検索レポート 検索レポート分析は、データを集計して、以下の検索レポートを生成する目的で使用された分析レポート データベースにそのデータを保存します。

クエリの数

よく使用されるクエリ

破棄されたクエリ

結果なしのクエリ

クエリ ルール利用状況

レポート情報は、検索インデックス内のアイテムではなく、Search service アプリケーションに保存されます。 Search service アプリケーションを削除した場合、レポート情報もまた削除されます。
ディープ リンク ディープ リンク分析は、検索結果内でユーザーが実際に何をクリックしているかについての情報を使用して、サイト上の最重要なサブページがどれかを計算します。 これらのページは、サイトでの重要なショートカットとして検索結果に表示され、ユーザーは、検索結果から、直接、それらの重要なサブページにアクセスできます。

利用状況分析

利用状況分析は、SharePoint Server サイト上での、ユーザー操作、あるいは、クリックまたは表示されたアイテムのような、使用イベントについての情報を受け取る一連の分析です。 利用状況分析は、この情報と、検索分析からのクロールしたコンテンツについての情報を組み合わせて、情報を処理します。 おすすめ候補と使用イベントについての情報は、検索インデックスに追加されます。 さまざまな使用状況イベントに関する統計情報が検索インデックスに追加され、Analytics レポート データベースに送信されます。

既定の使用状況イベントのセットは、既定で定義されています。 既定のイベントは、常に SharePoint Server に登録され、分析されます。 また、カスタムのイベント種類を構成できます。 既定の使用イベントの詳細については、「利用状況分析で使用される使用イベント」を参照してください。

利用状況分析での分析

分析 説明
利用状況カウント 利用状況カウント分析は、表示またはクリックされたアイテムのような、イベントを分析します。 この分析では、検索結果ページだけでなく、Word から文書を開いたり、SharePoint Server ライブラリでクリックしたりした場合など、 アイテムが全体で開かれた回数が計算されます。

この分析では、すべての定義されたイベント種類について、最近のイベントとすべての時間イベントの両方を計算します。 既定では、最近のイベントは過去 14 日間に設定されますが、1 日から 14 日 (オンプレミス) の間で設定できます。 統計データは、サイト レベル、サイト コレクション レベル、組織レベル (Microsoft 365 の SharePoint) で集計されます。

使用イベントは Web フロント エンドに一時的に保存され、15 分ごとに Search service アプリケーションにプッシュされます。 使用イベントは、最大 14 日間、ディスクに保持され、その後、削除されます。 毎日、前日全体の利用状況カウントのデータが分析されます。

利用状況カウントは、検索関連性を向上する目的で、検索インデックス内のアイテムに追加されます。 この情報は分析レポート データベースにも保存され、よく使用されるアイテムをサイトに表示する目的で使用できます。
推奨事項 おすすめ候補分析では、ユーザーがサイト上のアイテムに対して作業した方法に基づいて、アイテムの間でのおすすめ候補を作成します。 この分析では、利用状況カウントと同じイベント ファイルを使用しますが、利用状況内のパターンを探します。 この分析では、アイテム間の関係グラフを計算して、検索インデックス内のアイテムに情報を追加します。

この情報は、サイト上にたとえば「このアイテムを見た人は、このようなアイテムも見ています」 のようなおすすめ候補を表示する目的で使用できます。

データは、復元の目的で、分析レポート データベースに保存されます。 おすすめ候補に関連するレポートは、利用状況カウント分析に基づきます。
アクティビティ ランク付け アクティビティ ランク付け分析では、使用イベント (イベント レート) のアクティビティ追跡を使用して、検索の関連性を調整します。 一般的には、利用状況アクティビティ (クリックまたはビュー) が高いアイテムは、それほど使用されていないアイテムより、アクティビティ ランク スコアが高くなります。

この分析では、アイテムのアクティビティでの "傾向" を探します。 If you only count the number of events, older items will typically "win" in relevancy, because the older documents have had more time to collect activity. The activity tracking helps newer documents that have high usage activity get a higher rank.

利用状況分析で使用される使用イベント

SharePoint Server には、以下の既定の使用イベントが含まれます。

  • ビュー

  • 表示されたおすすめ候補

  • クリックされたおすすめ候補

既定のイベントに加えて、最大 12 のカスタム イベントを追加できます。 たとえば、アイテムが、モバイル プラットフォームからどれくらいの頻度でアクセスされるかを確認するカスタム イベントを追加できます。

すべての使用状況イベントは、アイテム、サイト コレクション、テナント (Microsoft 365 の SharePoint) ごとにカウントされます。

分析処理に基づくレポート

分析処理コンポーネントは、以下の利用状況レポートを作成する目的で使用されるデータを生成します。

  • 人気の傾向 SharePoint ライブラリまたはリスト内のサイト コレクション、サイト、または特定のアイテムに関する使用イベントごとの日単位および月単位のカウントを表示する Excel レポート。

    注:

    [一意のユーザー] には 1 日あたりの一意のユーザー数が表示され、1 か月あたりの一意ユーザー数にはその月の SUM(UU/Day) が表示されます。

  • 最も人気のあるアイテム ライブラリまたはリスト内 のすべてのアイテム (たとえば、ライブラリまたはリスト内の最も表示されている項目) の使用状況イベントごとのランク付けを表示します。 The ranking can be sorted by Recent or Ever.

分析処理コンポーネントによって収集されたデータのプライバシー保護

Analytics 処理コンポーネントは、個人を特定できる情報に関連するデータのこれらの部分を収集します。 SharePoint Server には、この情報のプライバシーを保護するためのさまざまな機能があります。

使用イベントごとに、分析処理コンポーネントが以下の情報をログに記録します。

  • 使用イベントが発生したアイテムの URL

  • 使用イベントが発生したサイト ID、Web ID、およびテナント ID

  • 使用イベントが発生した時刻と日付

  • 使用イベントを発生させた人物の暗号化ユーザー ID

このデータは、分析処理コンポーネントによって処理される前に Search Service アプリケーションで保存されます。 データは 30 日後に自動的に削除されます。 データ処理の結果を以下に示します。

  • 使用イベントの総数

  • 一意の使用イベントの総数

  • アイテム間のおすすめ候補

  • 関連付け機能

これらの結果は分析レポート データベースと検索インデックスに保存されます。 データ処理の結果としてのユーザー情報は保存されません。 暗号化ユーザー ID は、一意の使用イベント カウントとアイテム間のおすすめ候補の計算時にのみ使用されます。

結果は 2 つの使用情報レポートで確認できます。 詳細については、「SharePoint Server で利用状況レポートを表示する」を参照してください。

匿名ユーザーが含まれるサイトの利用状況 Cookie

既定で、利用状況 Cookie は SharePoint Server Web アプリケーションに対して有効になっていません。 匿名ユーザーを受け入れているサイトの一意のユーザー数とアイテム間のおすすめ候補を生成するために、SharePoint Server が SharePoint Web アプリケーションに対する利用状況 Cookie の使用を可能にします。 利用状況 Cookie を有効にすると、データの処理中にユーザー ID として使用される一意の GUID が生成されます。 GUID は Cookie の有効期間中に使用することができ、データの処理中はユーザー ID として使用されます。 Cookie の有効期間は 14 日間です。

重要

匿名ユーザーが含まれるサイトで Cookie を有効にすると、現地の法的制限が適用される場合があります。

SharePoint Web アプリケーションの使用状況 Cookie を有効にするには、「SharePoint Server で Web アプリケーションの全般設定を編集する」を参照してください。 この記事は、SharePoint Server 2016 にも適用されます。