Conectar-se ao Matillion
O Matillion ETL é uma ferramenta de ETL/ELT criada especificamente para plataformas de banco de dados de nuvem, incluindo o Azure Databricks. O Matillion ETL tem uma interface do usuário moderna baseada em navegador, com funcionalidade avançada e ETL/ELT de push-down.
Você pode integrar os SQL warehouses do Databricks (antigos pontos de extremidade de SQL do Databricks) e os clusters do Azure Databricks ao Matillion.
Conectar-se ao Matillion usando o Partner Connect
Esta seção descreve como usar o Partner Connect para simplificar o processo de conexão de um warehouse ou cluster de SQL existente em seu workspace do Azure Databricks ao Matillion.
Requisitos
Confira os requisitos para usar o Partner Connect.
Etapas para se conectar
Para se conectar ao Matillion usando o Partner Connect, siga as etapas nesta seção.
Dica
Se você tiver uma conta Matillion existente, o Databricks recomenda que você se conecte ao Matillion manualmente. Isso ocorre porque a experiência de conexão no Partner Connect é otimizada para novas contas de parceiro.
Na barra lateral, clique em Partner Connect.
Clique no bloco Matillion.
A caixa Email exibe o endereço de email da sua conta do Azure Databricks. O Matillion usa esse endereço de email para solicitar que você crie uma conta do Matillion ou entre em sua conta existente do Matillion.
Clique em Conexão na ETL do Matillion ou Entrar.
Uma nova guia é aberta no navegador que exibe o Hub do Matillion.
Conclua as instruções na tela no Matillion para criar sua conta de avaliação de 14 dias ou para entrar na sua conta existente do Matillion.
Importante
Se um erro for exibido informando que alguém da sua organização já criou uma conta com o Matillion, entre em contato com um dos administradores da sua organização e adicione-o à conta Matillion da sua organização. Depois que eles adicionarem você, entre em sua conta do Matillion existente.
Conclua as instruções na tela para fornecer os detalhes do trabalho e clique em Continuar.
Conclua as instruções na tela para criar uma organização e clique em Continuar.
Clique na organização que você criou e, em seguida, clique em Adicionar instância de ETL do Matillion.
Clique em Continuar no Azure.
O portal do Azure abre.
Siga a Inicialização de ETL do Matillion de um Modelo do ARM do Azure na documentação da ETL do Matillion, começando com a etapa 6.
Siga as instruções na documentação Matillion ETL.
A ETL do Matillion é aberto no navegador e a caixa de diálogo Criar Project é exibida.
Siga a Criar de um projeto Delta Lake em Databricks na documentação do Matillion.
Para as configurações na seção Conexão do Delta Lake nessas instruções, insira as seguintes informações:
- Para ID do Workspace, insira a ID do workspace do Azure Databricks de acordo com a URL do workspace. Não inclua nada após o primeiro "ponto" (
.
). Confira Nomes, URLs e IDs das instâncias de workspace. - Em Nome de usuário, insira a palavra
token
. - Em Senha, insira o valor de um token de acesso pessoal do Azure Databricks.
Para obter a ID do Workspace e gerar o token de acesso pessoal, faça o seguinte:
Retorne à guia Partner Connect no navegador.
Anote a ID do Workspace.
Clique em Gerar um novo token.
Uma nova guia é aberta no navegador que exibe a página Configurações da interface do usuário do Azure Databricks.
Clique em Gerar novo token.
Opcionalmente, insira uma descrição (comentário) e um período de expiração.
Clique em Gerar.
Copie o token de acesso pessoal gerado e armazene-o em um local seguro.
Retorne à guia do Matillion no navegador.
Para as configurações na seção Padrões do Delta Lake nessas instruções, para Cluster, escolha o nome do warehouse ou cluster de SQL.
- Para ID do Workspace, insira a ID do workspace do Azure Databricks de acordo com a URL do workspace. Não inclua nada após o primeiro "ponto" (
Continue com as Próximas etapas.
Conectar-se ao Matillion manualmente
Esta seção descreve como conectar manualmente um cluster ou warehouse de SQL existente no workspace do Azure Databricks ao Matillion.
Observação
Você pode se conectar ao Matillion usando o Partner Connect para simplificar a experiência.
Requisitos
Antes de se integrar ao Matillion manualmente, você precisa ter o seguinte:
Uma instância do Matillion ETL, que você pode iniciar usando o Azure Marketplace ou o ARM (Azure Resource Manager).
Um token de acesso pessoal do Azure Databricks ou um token do Microsoft Entra ID.
Observação
Como melhor prática de segurança, ao autenticar com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pertencentes às entidades de serviço e não aos usuários do workspace. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.
Etapas para se conectar
Para se conectar ao Matillion manualmente, faça o seguinte:
Obtenha o nome do recurso de computação existente que você deseja usar (um warehouse ou cluster de SQL) no workspace. Posteriormente, você escolherá esse nome para concluir a conexão entre o recurso de computação e a instância de ETL do Matillion.
- Para ver os SQL Warehouses em seu espaço de trabalho, clique em SQL Warehouses na barra lateral. Para criar um novo SQL warehouse, confira Criar um SQL warehouse.
- Para exibir os clusters em seu espaço de trabalho, clique em Computação na barra lateral. Para criar um cluster, consulte Referência de configuração de computação.
Siga Conectar-se à sua instância de ETL do Matillion e faça login na documentação do Matillion.
Siga a Criar de um projeto Delta Lake em Databricks na documentação do Matillion.
Para as configurações na seção Conexão do Delta Lake nessas instruções, insira as seguintes informações:
- Para ID do Workspace, insira a ID do workspace do Azure Databricks de acordo com a URL do workspace. Não inclua nada após o primeiro "ponto" (
.
). Confira Nomes, URLs e IDs das instâncias de workspace. - Em Nome de usuário, insira a palavra
token
. - Para Código de acesso, insira o token de acesso pessoal do Azure Databricks ou um token do Microsoft Entra ID.
Para as configurações na seção Padrões do Delta Lake nessas instruções, para Cluster, escolha o nome do warehouse ou cluster de SQL.
- Para ID do Workspace, insira a ID do workspace do Azure Databricks de acordo com a URL do workspace. Não inclua nada após o primeiro "ponto" (
Continue com as Próximas etapas.
Próximas etapas
Explore um ou mais dos seguintes recursos no site do Matillion: