Microsoft Syntex 中的自动填充列概述

注意

在 2025 年 6 月,如果你设置了 即用即付计费 ,则可以免费试用自动填充列和其他选定的 Syntex 服务。 有关信息和限制,请参阅 试用 Microsoft Syntex 并浏览其服务

Microsoft Syntex 中的自动填充列会自动从上传到 SharePoint 文档库的文件中提取、汇总或生成内容。 通过使用大型语言模型 (LLM) 生成 AI,自动填充列可以自动保存元数据,从而简化管理文件及其相关信息的过程。

例如,可以 (以自然语言 提示) 文档提出问题,系统将响应直接保存到指定的库列。 或者,可以将其中多个问题设置为处理上传到库的任何文件,每个响应都分配给特定列。

自动填充列可以与其他 Microsoft Syntex 模型一起使用。 可以将不同的提取提示关联 (从现有数据) 或生成提示中获取信息, (在其中创建新内容) 包含多个列,从而提取其他模型可能无法检测或生成的元数据。

要求和限制

支持语言

目前,自动填充列可用于英语语言文件。 其他语言将在将来的版本中添加。

支持的文件类型

自动填充列可用于以下文件类型:.csv、 .doc、.docx、.eml、.heic、.heif、.htm、.html、.jpeg、.jpg、.md、.msg、.pdf、.png、.ppt、.pptx、.rtf、.tif、.tiff、.txt、.xls 和 .xlsx。

支持的列数据类型

目前,自动填充列可用于以下列数据类型:

  • Text
  • 多行文本
  • 数字
  • 是/否
  • 日期和时间
  • 选项
  • Hyperlink
  • 货币

目前,自动填充列不适用于以下列数据类型:

  • 人员或组
  • 位置
  • 图像
  • 查找
  • 托管元数据

当前发行说明

  • 现有库文件的批量处理选项将在将来的版本中添加。

  • 目前,自动填充列不支持以下库类型:FormServerTemplates、SitePages、样式库和 SiteAssets。

  • 具有敏感度标签的文档不会分析或包含在结果中。

  • 仅当重新处理文件时,才会捕获文档更改,这必须由用户手动完成。

  • 自动填充列使用与文档处理模型相同的分类状态字段。

    注意

    AI 生成的内容可能不正确。 请务必检查列结果。

负责任的 AI 常见问题解答

AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 Microsoft 的负责任 AI 常见问题解答旨在帮助你了解 AI 技术的工作原理、系统所有者和用户可以做出的影响系统性能和行为的选择,以及考虑整个系统(包括技术、人员和环境)的重要性。 可以使用负责任 AI 常见问题解答来更好地了解 Microsoft 开发的特定 AI 系统和功能。

负责任的 AI 常见问题解答是将 Microsoft 的 AI 原则付诸实践的更广泛努力的一部分。 要了解详细信息,请参阅 Microsoft AI 原则

有关自动填充列的负责任 AI 常见问题解答

什么是自动填充列?

自动填充列提供了一个列设置,允许用户 (LLM) 提示构造大型语言模型,这些提示将自动对文件进行分类,从文件的内容中提取或生成信息 (提取特定值或字符串,或者根据某些条件) 生成摘要或响应,并将输出保存到列。

自动填充列可以做什么?

自动填充列允许使用保存的提示来处理创建或上传到 SharePoint 库的文件,并将响应保存到相应的列。 构造的提示基于文件,可用于提取、分类、汇总和分析其内容。 与其他列数据一样,可以索引保存的元数据、用于触发工作流,甚至定义设置信息保护标签的条件。

自动填充列的预期用途是什么?

自动填充列为用户提供元数据自动化。 用户可以使用它对文件进行分类、提取、汇总,甚至分析文件,然后将响应保存到列,然后在该列中对其进行索引并用于搜索或其他下游工作流进程。 自动填充列也可以是其他计算机语言模型的有用补充,在这些模型中,用户可以使用摘要或其他分析响应来补充从配置的模型提取的元数据。

如何计算自动填充列? 哪些指标用于衡量性能?

  • 一致性、流畅性和准确性等性能因素依赖于基础模型的性能 (在这种情况下,GPT-4 Turbo) 。

  • 评估的功能特定性能。 测试包括:

    • 创建了示例库,每个库都包含分类为合同、工作报表、福利更改通知、发票和简历的典型业务文档。

    • 创建了涵盖不同列类型的自动填充列,包括单行文本和多个选项。

    • 设计提示,例如“文档的类别是什么,请从 A、B、C 中进行选择。如果不是,则无答复。 或简历的“应聘者教育背景是什么”。

  • 查看了结果。 在大多数情况下,结果符合预期。 对于不符合满意阈值的结果,使用函数调用来改进结果。 不同 LLM 版本比较了一些结果。

  • 评估的风险和安全指标。

    • 设置:使用自动化程序发送与现实世界中的功能类似的请求,结合元数据提示、系统提示和用户问题或文档内容,在同一基本模型上运行 (在这种情况下,GPT-4 Turbo) 具有相同配置。

    • 评估:由于该功能的提示来自两个部分, (一个是文档内容,另一个是问题) ,我们准备了数百个测试用例。

      • 使用标准业务文档和有害问题评估的测试用例。 这些问题包含自我伤害、性、暴力或种族信息。

      • 评估了包含有害内容的测试用例,以及提示模型回答不应回答的问题。 例如,“汇总文档中的内容”。

    • 评估:遵循 Microsoft Azure AI Studio 中提供的 Microsoft 特选风险和安全指标说明,在本例中,使用 LLM (GPT-4 Turbo 从四个方面) 结果:自我伤害相关内容、仇恨和不公平内容、暴力内容和性内容。

      评估将输入和输出评级为 0-7,从危害最小的级别扩展到最严重的级别。

自动填充列有哪些限制? 用户在使用系统时如何尽量减少这些限制的影响?

  • 提示范围仅限于文件的文本内容。 响应是纯文本的,可以保存到关联的列。 虽然可以根据保存的响应配置其他操作,但输出本身无法执行进程。

  • 只有具有足够网站库权限的用户才能创建或编辑自动填充列提示。

  • 该服务由 Microsoft 365 管理中心中的租户设置管理。 管理员可设置其跨租户或特定站点的可用性。

哪些操作因素和设置允许有效和负责任地使用自动填充列?

  • 如果生成了用户无法接受的任何有害内容,租户管理员或 Microsoft 支持人员可以在站点或租户级别关闭此功能。

  • 用户界面中提供了 “发送反馈 ”链接。 对反馈进行监视、审查,并根据需要采取适当的操作,包括在某些情况下更新产品体验。