使用预生成模型检测 Microsoft Syntex 中文档的敏感信息

敏感信息 预生成模型 分析和检测文档中的关键信息,然后选择性地提取信息。 该模型识别各种格式的文档,并 检测敏感信息,例如个人和财务标识号、物理地址和电子邮件地址以及电话号码。

设置敏感信息模型

若要创建和配置敏感信息模型,请执行以下步骤:

  1. 按照 在 Syntex 中创建模型 中的说明创建敏感信息模型。 然后继续执行以下步骤以完成模型。

    注意

    创建敏感信息模型时,你会注意到,与其他模型不同,你没有用于选择内容类型或应用敏感度或保留标签的选项。 如果需要关联内容类型,则需要创建其他模型类型。 将来的版本中将提供应用安全标签的功能。

  2. “模型 ”页上的 “添加要检测的实体 ”部分中,选择“ 添加实体”。

    “新建模型”页的屏幕截图,其中显示了“添加要检测的实体”部分。

  3. “配置检测 ”页上:

    • 选择要用于此模型的语言。 每个模型只能选择一种语言。

      注意

      此模型支持 多种语言 ,并检测 手写文本印刷文本的敏感信息。

    • 从支持的实体列表中,选择要检测的一个或多个敏感信息实体,然后选择“ 下一步”。

    “配置检测”页的屏幕截图。

  4. “配置提取 ”页上,可以看到选择检测的敏感信息实体的列表。 选择要提取到列中的实体,然后选择“ 下一步”。

    “配置提取”页的屏幕截图。

  5. 在“ 测试模型 ”页上,测试模型以确保它检测并提取所需的实体。 选择“ +添加文件 ”以选择示例文件以测试模型。

    “测试模型”页的屏幕截图。

    注意

    此模型不会检测或提取加密文件的信息。

  6. “应用模型 ”页上,选择“ +添加库”,选择要应用此模型的库,然后选择“ 添加”。

    “应用模型”页的屏幕截图。

  7. 在文档库中,检测到的实体显示在“ 检测到的实体” 列中,选择提取的实体显示在各自的列中。

    库的屏幕截图,其中显示了检测到的实体。

有关此模型的文件类型、语言、光学字符识别和其他注意事项的信息,请参阅 Microsoft Syntex 中模型的要求和限制