连接到 Dataiku

Dataiku 是用于数据准备、AutoML 和 MLOps 的端到端 AI 平台。 你可以将 Databricks SQL 仓库和 Azure Databricks 群集与 Dataiku 集成。

使用 Partner Connect 连接到 Dataiku

注意

对于 Dataiku,Partner Connect 仅支持 SQL 仓库。 若要将群集连接到 Dataiku,请手动连接到 Dataiku。

要使用 Partner Connect 将 Azure Databricks 工作区连接到 Dataiku,请执行以下操作:

  1. 在边栏中单击 Partner Connect 按钮“Partner Connect”。

  2. 单击合作伙伴磁贴。

    注意

    如果 Dataiku 磁贴内有复选标记图标,则意味着管理员已使用 Partner Connect 将 Dataiku 连接到你的工作区。 跳到步骤 5。 合作伙伴将使用你的 Azure Databricks 帐户的电子邮件地址来提示你登录现有的 Dataiku 帐户。

  3. 从下拉列表中选择目录,然后单击“下一步”。

    注意

    如果工作区已启用 Unity Catalog,但合作伙伴不支持具有 Partner Connect 的 Unity Catalog,则使用工作区默认目录。 如果工作区未启用 Unity Catalog,则使用 hive_metastore

  4. 从下拉列表中选择架构,然后单击“添加”。 可以重复此步骤以添加多个架构。

  5. 单击“下一步”。

    Partner Connect 在工作区中创建以下资源:

    Partner Connect 还向 <PARTNER>_USER 服务主体授予以下权限:

    • (Unity Catalog) USE CATALOG:与所选目录中的对象进行交互所需。
    • (Unity Catalog) USE SCHEMA:授予读取所选架构的能力。
    • (Unity Catalog) CREATE SCHEMA:授予在所选目录中创建架构的能力。
    • (旧版 Hive 元存储)USAGE:与所选架构中的 hive_metastore 对象交互时必需。
    • (旧版 Hive 元存储)CREATE:授予在 hive_metastore 中创建架构的能力。
    • (旧版 Hive 元存储)READ_METADATA:授予读取所选架构的元数据的权利。
    • (旧版 Hive 元存储)SELECT:授予读取所选架构的能力。
  6. 单击“下一步”。

    “电子邮件”框显示 Azure Databricks 帐户的电子邮件地址。 Dataiku 使用此电子邮件地址提示你创建新的合作伙伴帐户或登录到现有的合作伙伴帐户。

  7. 单击“连接到 Dataiku”或“登录”。

    此时会在 Web 浏览器中打开一个新标签页,其中显示 Dataiku 网站。

  8. 完成 Dataiku 网站上的屏幕说明,以创建试用版 Dataiku 帐户或登录到现有的 Dataiku 帐户。

手动连接到 Dataiku

本部分介绍如何将 Azure Databricks 工作区中的现有 SQL 仓库或群集手动连接到 Dataiku。

注意

对于 Databricks SQL 仓库,可以使用 Partner Connect 来连接到 Dataiku,从而简化连接过程。

要求

手动连接到 Dataiku 之前,需要具备以下各项:

  • Azure Databricks 工作区中的群集或 SQL 仓库。

  • 群集或 SQL 仓库的连接详细信息,特别是“服务器主机名”、“端口”和“HTTP 路径”值。

  • Azure Databricks 个人访问令牌Microsoft Entra ID(以前称为 Azure Active Directory)令牌…… 若要创建个人访问令牌,请执行以下操作:

    1. 在 Azure Databricks 工作区中,单击顶部栏中的 Azure Databricks 用户名,然后从下拉列表中选择“设置”。
    2. 单击“开发人员”。
    3. 在“访问令牌”旁边,单击“管理”。
    4. 单击“生成新令牌”。
    5. (可选)输入有助于将来识别此令牌的注释,并将令牌的默认生存期更改为 90 天。 若要创建没有生存期的令牌(不建议),请将“生存期(天)”框留空(保留空白)。
    6. 单击“生成” 。
    7. 将显示的令牌复制到安全位置,然后单击“完成”。

    注意

    请务必将复制的令牌保存到安全的位置。 请勿与他人共享复制的令牌。 如果丢失了复制的令牌,你将无法重新生成完全相同的令牌, 而必须重复此过程来创建新令牌。 如果丢失了复制的令牌,或者认为令牌已泄露,Databricks 强烈建议通过单击“访问令牌”页上令牌旁边的垃圾桶(撤销)图标立即从工作区中删除该令牌。

    如果你无法在工作区中创建或使用令牌,可能是因为工作区管理员已禁用令牌或未授予你创建或使用令牌的权限。 请与工作区管理员联系,或参阅以下主题:

    注意

    作为安全最佳做法,在使用自动化工具、系统、脚本和应用进行身份验证时,Databricks 建议使用属于服务主体(而不是工作区用户)的个人访问令牌。 若要为服务主体创建令牌,请参阅管理服务主体的令牌

连接步骤

若要手动连接到 Dataiku,请按照 Dataiku 文档中的 Databricks 进行操作。

其他资源

浏览以下 Dataiku 资源: