Integração do DBeaver com o Azure Databricks

Observação

Este artigo aborda o DBeaver, que não é fornecido nem tem suporte do Databricks. Para entrar em contato com o provedor, use a página Problemas do repositório dbeaver/dbeaver no GitHub.

O DBeaver é uma ferramenta de banco de dados local e de várias plataformas para desenvolvedores, administradores de banco de dados, analistas de dados, engenheiros de dados e outros que precisam trabalhar com bancos de dados. O DBeaver dá suporte ao Azure Databricks, bem como a outros bancos de dados populares.

Este artigo descreve como usar o computador de desenvolvimento local para instalar, configurar e usar o DBeaver Community Edition (CE) de código aberto e gratuito para trabalhar com bancos de dados no Azure Databricks.

Observação

Este artigo foi testado com o macOS, Databricks JDBC Driver versão 2.6.36 e DBeaver CE versão 23.3.0.

Requisitos

Antes de instalar o DBeaver, o computador de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux de 64 bits, macOS ou Windows de 64 bits. (Há suporte para o Linux 32 bits, mas não é recomendado.)
  • Baixe o Driver JDBC do Databricks no computador de desenvolvimento local, extraindo o arquivo DatabricksJDBC42.jar do arquivo DatabricksJDBC42-<version>.zip baixado.

Você também deve ter um cluster do Azure Databricks ou um SQL warehouse para se conectar ao DBeaver.

Etapa 1: instalar o DBeaver

Baixe e instale o DBeaver CE da seguinte maneira:

  • Linux: baixe e execute um dos instaladores do Linux na página Download no site do DBeaver. As opções de instalação snap e flatpak também são fornecidas nessa página.
  • macOS: use Homebrew para executar brew install --cask dbeaver-community, ou use MacPorts para executar sudo port install dbeaver-community. Um instalador do macOS também está disponível na página Download no site do DBeaver.
  • Windows: use Chocolatey para executar choco install dbeaver. Um instalador do Windows também está disponível na página Download no site do DBeaver.

Etapa 2: configurar o Driver JDBC do Azure Databricks para DBeaver

Configure o DBeaver com informações sobre o Driver JDBC do Databricks que você baixou anteriormente.

  1. Inicie o DBeaver.
  2. Se você receber uma solicitação para criar um novo banco de dados, clique em Não.
  3. Se você receber uma solicitação para se conectar a ou selecione um banco de dados, clique em Cancelar.
  4. Clique em Banco de dados> Gerenciador de Driver.
  5. Na caixa de diálogo Gerenciador de Driver, clique em Novo.
  6. Na caixa de diálogo Criar novo driver, clique na guia Bibliotecas.
  7. Clique em Adicionar Arquivo.
  8. Navegue até a pasta para a qual você extraiu o Driver JDBC do Azure Databricks.
  9. Navegue um nível abaixo para encontrar o arquivo .jar.
  10. Realce o arquivo .jar e clique em Abrir.
  11. Na guia Configurações, em Nome do Driver, insira Databricks.
  12. Na guia Configurações, em Nome da Classe, insira com.databricks.client.jdbc.Driver.
  13. Clique em OK.
  14. Na caixa de diálogo Gerenciador de Driver, clique em Fechar.

Etapa 3: Conectar o DBeaver aos seus bancos de dados do Azure Databricks

Use o DBeaver para se conectar ao cluster ou ao SQL warehouse a fim de acessar os bancos de dados no workspace do Azure Databricks.

  1. Em DBeaver, clique em Banco de dados> Nova Conexão de Banco de dados.

  2. Na caixa de diálogo Conectar-se a um banco de dados, na guia Tudo, clique em Databricks e clique em Avançar.

  3. Clique na guia Principal e insira um valor no campo URL do JDBC para seu recurso do Azure Databricks. Para obter a sintaxe do campo URL do JDBC, confira Configurações de autenticação para o Driver de JDBC do Databricks.

  4. Clique em Testar Conexão.

    Dica

    Você deve iniciar o recurso do Azure Databricks antes de testar sua conexão. Caso contrário, o teste pode demorar vários minutos para ser concluído enquanto o recurso é iniciado.

  5. Se a conexão for bem-sucedida, na caixa de diálogo Teste de Conexão, clique em OK.

  6. Na caixa de diálogo Conectar-se a um banco de dados, clique em Concluir.

Na janela Navegador de Banco de Dados, uma entrada de Databricks é exibida. Para alterar o nome da conexão para facilitar a identificação:

  1. Clique com o botão direito do mouse em Databricks e clique em Editar Conexão.
  2. Na caixa de diálogo Configuração de conexão, clique em Geral.
  3. Em Nome da conexão, substitua Databricks por um nome diferente para a conexão.
  4. Clique em OK.

Repita as instruções nessa etapa para cada recurso que você deseja que o DBeaver acesse.

Etapa 4: Usar o DBeaver para procurar objetos de dados

Use o DBeaver para acessar objetos de dados em seu workspace do Azure Databricks, como tabelas e propriedades de tabela, exibições, índices, tipos de dados e outros tipos de objeto de dados.

  1. No DBeaver, na janela Navegador de banco de dados, clique com o botão direito do mouse na conexão que você quer usar.

  2. Se a opção Conexão estiver habilitada, clique nela. (Se Conexão estiver desabilitada, você já estará conectado.)

    Dica

    Inicie o recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Expanda a conexão à qual você acabou de se conectar.

  4. Expandir e procurar objetos de dados disponíveis. Clique duas vezes em um objeto de dados para obter mais informações sobre ele.

Repita as instruções nesta etapa para acessar objetos de dados adicionais.

Etapa 5: Usar o DBeaver para executar instruções SQL

Use o Beaver para carregar a tabela trips de exemplo do esquema nyctaxi do catálogo samples.

  1. No DBeaver, na janela Navegador de banco de dados, clique com o botão direito do mouse na conexão que você quer usar.

  2. Se a opção Conexão estiver habilitada, clique nela. (Se Conexão estiver desabilitada, você já estará conectado.)

    Dica

    Inicie o recurso antes de tentar se conectar a ele. Caso contrário, a conexão pode levar vários minutos para ser concluída enquanto o recurso é iniciado.

  3. Clique em SQL Editor > Novo Script de SQL.

  4. Na guia (connection-name) Script-1, insira esta instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Clique Editor SQL> Executar script SQL.

Próximas etapas

Recursos adicionais