Databricks 助手是什么?

Databricks 助手是一个基于 AI 的帮手,可充当与你搭档的程序员和支持专员,以方便你在创建笔记本、查询、仪表板和文件时提升效率。 它可以帮助你通过生成、优化、完成、解释和修复代码和查询来快速回答问题。

本页面介绍了有关助手的一般信息。 有关隐私和安全的问题,请参阅隐私和安全

如何向 Databricks 助手寻求帮助?

Databricks 助手可帮助完成以下任务:

助手使用 Unity Catalog 元数据来了解整个公司的表、列、说明和热门数据资产,以提供个性化的响应。

Databricks 助手生成的代码用于在 Databricks 计算环境中运行。 它经过优化,可在 Databricks 支持的编程语言、框架和方言中创建代码。 它不用作常规用途的编程助手。 此助手通常使用 Databricks 资源(如 Databricks 文档网站或知识库)中的信息来更好地回答用户查询的问题。 当用户问题与可用 Databricks 文档、Unity Catalog 和工作区内用户代码中的知识回答的问题相关时,该助手表现最佳。

从 Databricks 助手获取编码帮助

要访问 Databricks 助手,请单击笔记本左侧栏、文件编辑器、SQL 编辑器或仪表板的“数据”选项卡中的“助手”图标产品内助手图标 - 颜色

Databricks 助手图标和面板位置

“助手”窗格可以在屏幕左侧或右侧打开。

在运行助手生成的代码之前,用户应始终检查这些代码,因为这种代码有时可能会出错。

使用 Databricks 助手创建数据可视化效果

在创建仪表板草稿时,可以使用 Databricks 助手。 在现有仪表板数据集上创建可视化效果时,请用问题提示助手,以便接收采用生成的图表形式的响应。 若要在仪表板中使用助手,请先创建一个或多个数据集,然后将可视化小组件添加到画布。 可视化小组件包括描述新图表的提示。 键入要查看的图表的描述,助手将会生成相应的图表。 可以批准或拒绝图表,或修改描述以生成新的图表。

有关将助手与仪表板仪表板配合使用的详细信息和示例,请参阅使用 Databricks 助手创建可视化效果

Databricks 助手使用的服务

Databricks Assistant 使用 Azure OpenAI 服务提供响应。

Azure OpenAI 服务由 Microsoft 而不是 OpenAI 运营,并受其各自的数据管理策略约束。 发送到此服务的数据不用于任何模型训练。 有关详细信息,请参阅 Azure 数据管理策略

对于 Azure OpenAI,Azure Databricks 已选择禁用滥用监视,因此对于 Azure OpenAI 不会存储任何提示或响应。

用于提高结果准确性的技巧

  • 使用提示词“查找表”获取更好的响应。 在向表中的数据提问之前,请让助手按主题或其他特征查找相关表。 示例:Find tables related to NFL games

  • 指定所需的响应结构。 Databricks 助手提供的结构和详细信息会变化,即使使用相同的提示词也是如此。 Databricks 助手了解你的表和列架构以及元数据,因此你可以使用自然语言提问。 示例:List active and retired NFL quarterbacks' passing completion rate, for those who had over 500 attempts in a season. 助手使用列(如 s.player_ids.attempts)中的数据回答。

  • 提供行级数据值的示例。 Databricks 助手无法访问行级数据,因此,为了获得更准确的答案,会提供数据示例。 示例:List the average height for each position in inches。 这会返回错误,因为数据集以英尺和英寸为单位显示高度,如 6-2 中所示。

  • 通过在“助手”窗格中运行代码片段来测试代码片段。 使用“助手”窗格作为一个暂存板,用于保存查询迭代和助手的回答。 可以在窗格中运行并编辑代码,直到准备好将其添加到笔记本。

    通过在“助手”窗格中运行代码片段来测试代码片段。

  • 在笔记本中使用单元格操作。 单元格操作包括常见任务的快捷方式,例如记录(注释)、修复和解释代码。

    /doc 单元格操作提示助手为代码添加注释。

有关完整演示的示例,请参阅《Databricks 助手的 5 个使用技巧》

Databricks 助手会考虑对话的历史记录,以便你可以根据需要优化问题。

Databricks 助手的定价如何?

所有客户的当前 Databricks 助手功能均无需额外付费。

用户只需为用于运行笔记本、查询、作业等内容的计算付费。 为防止滥用,有公平的使用限制。 大多数用户不受这些限制的影响。

提供反馈

发送反馈的最佳方式是使用笔记本和 SQL 编辑器中的“提供反馈”链接。 还可以向 assistant-feedback@databricks.com 或向帐户团队发送电子邮件。

请分享产品改进建议和用户体验问题,而不是有关提示词准确性的反馈。 如果从助手收到没有帮助的建议,请单击“无用”拇指向下图标按钮。

助手功能的地区可用性

Databricks 助手是一项指定服务,在处理客户内容时按照地区来管理数据驻留。 若要详细了解不同地理区域中助理功能的可用性,请参阅 Databricks 指定服务

隐私和安全

问:向模型发送哪些数据?

Databricks 助手将代码和元数据发送到每个 API 请求上的模型。 这有助于为数据返回更相关的结果。 示例包括:

  • 当前笔记本单元格或 SQL 编辑器选项卡中的代码/查询
  • 表和列的名称和说明
  • 以前的问题
  • 收藏表

问:发送到模型的元数据是否遵循用户的 Unity Catalog 权限?

是,发送到模型的所有数据都遵循用户的 Unity Catalog 权限,因此不会发送与用户无权查看的表相关的元数据。

问:如果我使用结果执行查询,然后提出一个问题,我的查询结果是否会发送到模型?

否,仅与模型共享单元格中的代码内容、有关表的元数据以及用户输入的文本。 对于“修复错误”功能,Databricks 还共享错误输出中的堆栈跟踪。

问:Databricks 助手会执行危险代码吗?

否。 Databricks 助手不会代表你自动运行代码。 AI 模型可能会犯错误、误解意图、产生幻觉或给出不正确的答案。 在运行 AI 生成的代码之前查看并测试这些代码。

问:Databricks 是否进行了任何评估来评估助手响应的准确性和适当性?

是的。 Databricks 已经采取了缓解措施,以防止助手生成有害的响应,例如仇恨言论、不安全的代码、提示越狱和第三方版权内容。 Databricks 使用数千条模拟的用户输入对我们的 AI 辅助功能进行了广泛的测试,以评估缓解措施的可靠性。 这些评估侧重于助手的预期用例,例如使用 Python、Databricks SQL、R 和 Scala 语言生成代码的情况。

问:是否可以对处理受管制数据的表使用 Databricks 助手(PHI、PCI、IRAP、FedRAMP)?

是的。 要这样做,你必须符合启用合规性安全配置文件等要求,并将相关合规性标准添加为合规性安全配置文件配置的一部分。