描述 Microsoft Purview 信息保护的数据分类功能
组织需要了解其数据,以识别各种环境中的重要信息,并确保根据合规性要求处理数据。 管理员可以通过 Microsoft Purview 门户中提供的数据分类和资源管理器功能支持组织了解其数据。
敏感信息类型
敏感信息类型 (SIT) 是基于模式的分类器。 它们具有可用于识别其自身的设置模式。 例如,国家/地区的标识号可基于特定的模式,如下所示:
123-456-789-ABC
Microsoft Purview 包含许多内置敏感信息类型,这些类型基于由正则表达式 (regex) 或函数定义的模式。
示例包括:
- 信用卡号
- 护照或身份证号码
- 银行帐号
- 医保卡号
有关可用内置敏感信息类型的列表,请参阅敏感信息类型实体定义。
Microsoft Purview 中的数据分类还支持创建自定义敏感信息类型,以满足组织特定的要求。 例如,组织可能需要创建敏感信息类型来显示员工 ID 或项目号。
还支持完全数据匹配 (EDM) 分类。 利用基于 EDM 的分类能够创建自定义敏感信息类型,这些信息类型涉及敏感信息数据库中的精确值。 在 Microsoft Purview 门户中,敏感信息类型称为 EDM 分类器。
敏感信息类型可用于敏感度标签、保留标签,以及许多 Microsoft Purview 和 Microsoft Priva 解决方案。
可训练分类器
可训练分类器使用人工智能和机器学习智能地对数据进行分类。 它们通常用于对组织独有的数据进行分类,例如特定类型的合同、发票或客户记录。 这种分类方法更关注对分类器进行训练,使其能够根据项本身的特性识别项,而不是根据项中的元素(模式匹配)来识别。 有两种分类器可供选择:
预训练的分类器 - Microsoft 已创建并预训练了许多分类器,这些分类器无需训练即可开始使用。 这些分类器的状态显示为“可供使用”。 Microsoft Purview 提供五种预训练的分类器,可用于检测简历、源代码、骚扰、猥亵和威胁(涉及暴力或身体伤害)等信息并对其进行分类。
自定义可训练分类器 - Microsoft 支持创建和训练自定义分类器。 它们通常用于对组织独有的数据进行分类,例如特定类型的合同、发票或客户记录。
若要使自定义可训练分类器能够精确地将某个项目标识为特定的内容类别,则必须首先向其提供许多具有该类别中的内容类型的示例。 此正面示例的馈送称为种子设定,可用于为分类器创建预测模型。
此模型通过测试后可用于确定分类器是否可以正确区分与类别匹配的项和不匹配的项。 每个预测结果都会经过人工验证,然后作为输入来提高预测模型的精确性。
在模型的精确性分数稳定后,即可发布分类器。 然后可训练分类器可以对 SharePoint Online、Exchange 和 OneDrive 等位置中的项进行排序,并对内容进行分类。
注意
目前,分类器仅适用于未加密的项。
了解并浏览数据
数据分类可能会涉及大量的文档和电子邮件。 为了帮助管理员获取见解和理解,Microsoft Purview 门户中“信息保护”下的“资源管理器”节点提供了活动资源管理和内容浏览器等工具,可用于一目了然地查看详细信息,其中包括:
- 分类为敏感信息的项数量及其所属的分类。
- 敏感数据位置的详细信息。
- 用户对组织内敏感内容执行的操作的摘要。
管理员还可以使用这些工具获取的信息来指导其操作。
内容浏览器:内容浏览器提供带有敏感度标签、保留标签或在你所在组织中已归类为敏感信息类型的项目的快照。 它通过允许具有相应角色权限的管理员访问和查看存在各种不同位置(例如 Exchange、SharePoint 和 OneDrive)的已扫描的源内容,支持其进一步深入了解项目。
内容资源管理器的访问权限受到高度限制,因为它使我们能够读取扫描文件的内容。 需要访问内容资源管理器的用户必须在一个或多个内容资源管理器角色组中具有帐户。
活动资源管理器:活动资源管理器展示已发现和已标记的内容,以及内容的位置。 它使我们能够监视组织内对标记内容所执行的操作。 管理员可以了解标签更改和降级等文档级活动(例如,当某人将标签从机密更改为公共时,或将文件复制到可移动媒体或网络共享时)。
管理员可以使用筛选器查看特定标签的所有详细信息,如文件类型、用户和活动。 活动资源管理器有助于了解在一段时间内对标记内容所执行的操作。 管理员可以使用活动资源管理器来评估已实施的控制措施是否有效。