Conectar-se ao Dataiku
Dataiku é uma plataforma de IA de ponta a ponta para preparação de dados, Mosaic AutoML e MLOps. Você pode integrar os warehouses do Databricks SQL e os clusters do Azure Databricks ao Dataiku.
Conecte-se ao Dataiku usando o Partner Connect
Observação
O Partner Connect só dá suporte a warehouses de SQL para Daitaku. Para conectar um cluster ao Dataiku, conecte-se ao Dataiku manualmente.
Para conectar seu workspace do Azure Databricks ao Dataiku usando o Partner Connect, faça o seguinte:
Na barra lateral, clique em Partner Connect.
Clique no bloco do parceiro.
Observação
Se o bloco do Dataiku tiver um ícone de marca de seleção dentro dele, um administrador já usou o Partner Connect para conectar o Dataiku ao seu workspace. Pule para a etapa 5. O parceiro usa o endereço de email para sua conta do Azure Databricks para solicitar que você entre em sua conta existente do Dataiku.
Selecione um catálogo na lista suspensa e clique em Próximo.
Observação
Se o workspace estiver habilitado para Catálogo do Unity, mas o parceiro não oferecer suporte ao Catálogo do Unity com o Partner Connect, será usado o catálogo padrão do workspace. Se o workspace não estiver habilitado para Catálogo do Unity, será usado o
hive_metastore
.Selecione um esquema na lista suspensa e clique em Adicionar. Você pode repetir essa etapa para adicionar vários esquemas.
Clique em Avançar.
O Partner Connect cria os seguintes recursos no seu espaço de trabalho:
- Uma entidade de serviço do Azure Databricks chamada
<PARTNER>_USER
. - Um token de acesso pessoal do Azure Databricks que está associado à entidade de serviço
<PARTNER>_USER
.
O Partner Connect também concede os seguintes privilégios à entidade de serviço
<PARTNER>_USER
:- (Catálogo do Unity)
USE CATALOG
: necessário para interagir com objetos no catálogo selecionado. - (Catálogo do Unity)
USE SCHEMA
: concede a capacidade de ler os esquemas selecionados. - (Catálogo do Unity)
CREATE SCHEMA
: concede a capacidade de criar esquemas no catálogo selecionado. - (Metastore do Hive herdado)
USAGE
: necessário para interagir com objetos dentro dehive_metastore
e os esquemas selecionados. - (Metastore do Hive herdado)
CREATE
: concede a capacidade de criar um esquema emhive_metastore
. - (Metastore do Hive herdado) READ_METADATA: concede a capacidade de ler os metadados dos esquemas selecionados.
- (Metastore do Hive Herdado) SELECIONAR: concede a capacidade de ler os esquemas selecionados.
- Uma entidade de serviço do Azure Databricks chamada
Clique em Avançar.
A caixa Email exibe o endereço de email da sua conta do Azure Databricks. O Dataiku usa esse endereço de email para solicitar que você crie uma nova conta de parceiro ou entre em sua conta de parceiro existente.
Clique em Conectar-se ao Dataiku ou Entrar.
Uma nova guia será aberta no navegador da Web, exibindo o site do Dataiku.
Conclua as instruções na tela no site do Dataiku para criar sua conta do Dataiku de avaliação ou entrar em sua conta existente do Dataiku.
Conectar-se ao Dataiku manualmente
Esta seção descreve como conectar manualmente um cluster ou warehouse de SQL existente no workspace do Azure Databricks ao Daitaku.
Observação
Para warehouses do Databricks SQL, você pode se conectar ao Daitaku usando o Partner Connect para simplificar a experiência.
Requisitos
Antes de se conectar ao Dataiku manualmente, você precisará do seguinte:
Um cluster ou SQL warehouse do workspace do Azure Databricks.
Os detalhes da conexão do cluster ou do SQL warehouse, especificamente os valores nome do Host do Servidor, Porta e Caminho HTTP.
Um token de acesso pessoal do Azure Databricks ou um token do Microsoft Entra ID (antigo Azure Active Directory). Para criar um token de acesso pessoal, faça o seguinte:
- No workspace do Azure Databricks, clique no nome de usuário do Azure Databricks na barra superior e selecione Configurações na lista suspensa.
- Clique em Desenvolvedor.
- Ao lado de Tokens de acesso, clique em Gerenciar.
- Clique em Gerar novo token.
- (Opcional) Insira um comentário que ajude você a identificar esse token no futuro e altere o tempo de vida padrão do token de 90 dias. Para criar um token sem tempo de vida (não recomendado), deixe a caixa Tempo de vida (dias) vazia (em branco).
- Clique em Gerar.
- Copie o token exibido para um local seguro e clique em Concluído.
Observação
Lembre-se de salvar o token copiado em um local seguro. Não compartilhe seu token copiado com outras pessoas. Se você perder o token copiado, não poderá regenerar exatamente aquele mesmo token. Em vez disso, será necessário repetir esse procedimento para criar um novo token. Caso você tenha perdido o token copiado ou acredite que ele tenha sido comprometido, o Databricks recomenda que você exclua imediatamente esse token do seu workspace clicando no ícone de lixeira (Revogar) ao lado do token na página de Tokens de acesso.
Se você não conseguir criar ou usar tokens em seu workspace, isso pode ocorrer porque o administrador do workspace desabilitou tokens ou não deu permissão para criar ou usar tokens. Consulte o administrador do espaço de trabalho ou os seguintes tópicos:
Observação
Como melhor prática de segurança, ao autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pertencentes às entidades de serviço e não aos usuários do workspace. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.
Etapas para se conectar
Para se conectar ao Dataiku manualmente, siga Databricks na documentação do Dataiku.
Recursos adicionais
Explore os seguintes recursos do Dataiku: