SharePoint Server 中的分析处理概述

适用于:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

To help identify and surface the content that users consider to be the most useful and relevant, the Analytics Processing Component in SharePoint Server analyzes both the content itself, and also the way that users interact with it. The results from the analysis are added to the items in the search index so that search relevance improves automatically over time. 同时,分析结果还用于报告,帮助搜索管理员确定可以手动执行哪些步骤来改进搜索系统。

分析体系结构

分析体系结构包含以下主要部分:

  • 分析处理组件 可运行分析作业。 有关详细信息,请参阅 不同类型的分析

  • 分析报告数据库 存储不同分析中的统计信息,例如使用率事件数。 SharePoint Server 使用此数据库中的信息为搜索管理员创建 Excel 报告。 有关详细信息,请参阅 使用率分析基于分析处理的报告

  • 链接数据库 存储有关搜索和已爬网文档的信息。 此数据库中的数据通过不同的子分析进行处理。 有关详细信息,请参阅搜索分析

不同类型的分析

分析处理组件运行两种主要类型的分析:“搜索分析”和“使用率分析”。 Search analytics analyzes content in the search index, and usage analytics analyzes the user actions.

  • 搜索分析分析要进行爬网并添加到搜索索引的内容。

  • 使用率分析分析 SharePoint Server 网站上的用户操作或使用率事件(如点击量或已查看项目)。

搜索分析

搜索分析是一组分析,在对内容进行爬网和处理以及存储在搜索索引中时,从内容中提取链接和定位文本等信息。 提取的信息与有关搜索结果单击的信息一起存储在链接数据库中。 链接数据库中的信息在多个子分析中进一步处理。

搜索分析生成的信息用于丰富搜索索引中的项目,这些信息可帮助提高相关性和改进检索,并存储在报告数据库中且包含在报告中。

搜索分析中的分析

分析 说明
定位文本处理 定位文本处理分析内容集中项目的互连方式。 它还包括与分析中的链接关联的定位文本。 分析处理组件使用分析结果向搜索索引中的项目添加排名分数。
单击距离 单击距离分析计算权威页面和搜索索引中的项目之间的点击量。 权威页面可以是顶级网站,例如 , https://www.contoso.com或其他被视为重要的页面。 可以在管理中心中定义权威页。

分析处理组件使用分析结果向搜索索引中的项目添加排名分数。
搜索单击 搜索单击分析使用有关用户在搜索结果中单击哪些项目以升级或降级搜索索引中的项目的信息。 分析计算与基本相关性相比的新的项目排名。

单击数据存储在链接数据库中。
社会性标签 社会性标签分析可分析社会性标签,这些标签是用户可对内容应用以按对其有意义的方式分类信息的词或短语。

在 SharePoint Server 中,默认情况下社会性标签不用于精简、排名或检索。 但是,可以创建使用社会性标签和此分析中的信息的自定义搜索体验。
社会距离 社会距离分析计算使用追踪人员功能的用户之间的关系。 该分析计算第一级和第二级追踪:首先是第一级追踪,然后是后续追踪。

该信息用于按社会距离对人员搜索结果进行排序。
搜索报告 搜索报告分析可汇总数据并将数据存储在其用于生成这些搜索报告的分析报告数据库中:

查询数

热门查询

弃用的查询

无结果查询

查询规则使用情况

报告信息保存在搜索服务应用程序中,且不包含搜索索引中的项目。 如果删除搜索服务应用程序,还将删除报告信息。
深度链接 深度链接分析使用有关哪些人员会实际单击搜索结果以计算网站上最重要的子页面的信息。 这些页面将作为网站重要的快捷方式显示在搜索结果中,且用户可以直接从搜索结果中访问相关的子页面。

使用率分析

使用情况分析是在 SharePoint Server 网站上接收有关用户操作或使用事件(如点击量或已查看项目)的一系列分析。 使用情况分析将此信息与有关搜索分析中已爬网内容的信息结合在一起,并处理这些信息。 有关建议和使用事件的信息将添加到搜索索引。 有关不同使用情况事件的统计信息将添加到搜索索引,并发送到 Analytics 报告数据库。

默认的使用事件集是现成定义的。 默认事件始终由 SharePoint Server 注册和分析。 还可以配置自定义事件类型。 有关默认使用事件的详细信息,请参阅使用率分析所使用的使用率事件

使用率分析中的分析

分析 说明
使用计数 使用计数分析可分析诸如已查看或点击的项目的事件。 分析计算项目 的总体打开次数,不仅从搜索结果页面打开,还计算(例如,从 Word 打开文档或在 SharePoint Server 库中单击文档)的次数。

该分析计算所有已定义事件类型的最近事件和全部时间的事件。 默认情况下,最近事件设置为过去 14 天,但你可以将其设置为 1 到 14 天, (本地) 。 统计数据在 Microsoft 365) 中的 SharePoint 网站级别、网站集级别和组织级别 (聚合。

使用率事件临时存储在 Web 前端且每 15 分钟推送到 Search Service 应用程序一次。 使用率事件被删除之前在磁盘上最多保留 14 天。 每天将分析之前全天的使用计数数据。

使用计数将添加到搜索索引中的项目以提高搜索相关性。 该信息同样存储在分析报告数据库中,且可用于显示网站上的热门项目。
建议 建议分析可基于用户与网站上的项目交互的方式在项目之间创建建议。 该分析使用与使用计数相同的事件文件,但查找使用情况的模式。 该分析计算项目到项目的关系图并将信息添加到搜索索引中的项目。

该信息可用于在网站上显示建议,例如"同样可以查看已查看此信息的人"。

数据存储在分析报告数据库中以便进行恢复。 与建议相关的报告以使用计数分析为基础。
活动排名 活动排名分析使用使用率事件(事件率)的活动排名影响搜索相关性。 具有高使用率活动(点击或查看)的项目通常会取得较不太热门的项目更高的活动排名分数。

该分析查找项目活动中的趋势。 如果只对事件数进行计数,较旧的项目通常将在相关性方面"取胜",因为较旧的文档具有更多时间可收集活动。 活动排名可帮助具有高使用率活动的较新的文档取得更高排名。

使用率分析所使用的使用率事件

SharePoint Server 包括以下默认使用事件:

  • 视图

  • 显示的建议

  • 点击的建议

除了默认事件之外,可以添加多达 12 个自定义事件。 例如,可以添加跟踪从移动平台中访问某个项目的频率的自定义事件。

Microsoft 365) 中,按项目、网站集和租户 (SharePoint 计算所有使用情况事件。

基于分析处理的报告

分析处理组件生成用于创建以下使用率报告 的数据:

  • 热门程度趋势 显示 SharePoint 库或列表中网站集、网站或特定项目每个使用率事件的每日和每月计数的 Excel 报告。

    注意

    唯一用户显示每天的唯一用户数,而“每月唯一用户数显示当月的 SUM (UU/Day) 。

  • 最受欢迎的项目 显示库或列表中 所有项 (例如库或列表中查看次数最多的项)的按使用情况事件排名。 The ranking can be sorted by Recent or Ever.

分析处理组件收集的数据的隐私保护

分析处理组件收集与个人身份信息相关的数据部分。 SharePoint Server 具有不同的功能来保护此信息的隐私。

对于每个使用率事件,分析处理组件将记录以下信息:

  • 发生使用率事件的项目的 URL。

  • 发生使用率事件的 SiteID、WebID 和 TenantID。

  • 使用率事件发生的时间和日期。

  • 导致使用率事件发生的用户的经过模糊处理的用户 ID。

此数据在分析处理组件处理之前存储在 Search Service 应用程序中。 此数据在 30 天后将自动删除。 以下列表显示了数据处理的结果:

  • 使用率事件的总数。

  • 唯一使用率事件的总数。

  • 项目到项目的建议。

  • 相关性功能。

这些结果存储在分析报告数据库和搜索索引中。 不会存储数据处理产生的用户信息。 经过模糊处理的用户 ID 仅在计算唯一使用率事件计数和计算项目到项目建议时使用。

您可以在两个使用率报告中查看结果。 有关详细信息,请参阅View usage reports in SharePoint Server

具有匿名用户的网站的使用 Cookie

默认情况下,SharePoint Server Web 应用程序未启用使用 Cookie。 要为具有匿名用户的网站生成唯一用户计数和项目到项目建议,SharePoint Server 允许为 SharePoint Web 应用程序启用使用 Cookie。 启用使用 Cookie 后,这将生成在处理数据时用作用户 ID 的唯一 GUID。 GUID 可用于 Cookie 的生存期,且在处理数据时用作用户 ID。 Cookie 的生存期为 14 天。

重要

如果你在具有匿名用户的网站上启用 Cookie,则可能适用当地法律限制。

要为 SharePoint Web 应用程序启用使用 Cookie,请参阅编辑 web 应用程序在 SharePoint 服务器的常规设置。 本文也适用于 SharePoint Server 2016。