Integração do DataGrip ao Azure Databricks

Observação

Este artigo aborda o DataGrip, que não é fornecido nem tem suporte do Databricks. Para entrar em contato com o provedor, confira o Suporte do DataGrip.

DataGrip é um ambiente de desenvolvimento integrado (IDE) para desenvolvedores de banco de dados que fornece um console de consulta, navegação de esquema, planos de explicação, conclusão de código inteligente, análise em tempo real e correções rápidas, refatoração, integração de controle de versão e outros recursos.

Este artigo descreve como usar o computador de desenvolvimento local para instalar, configurar e usar o DataGrip para trabalhar com bancos de dados no Azure Databricks.

Observação

Este artigo foi testado com o macOS, Databricks JDBC Driver versão 2.6.36 e DataGrip versão 2023.3.1.

Requisitos

Antes de instalar o DataGrip, o computador de desenvolvimento local deve atender aos seguintes requisitos:

  • Um sistema operacional Linux, macOS ou Windows.
  • Baixe o Driver JDBC do Databricks no computador de desenvolvimento local, extraindo o arquivo DatabricksJDBC42.jar do arquivo DatabricksJDBC42-<version>.zip baixado.
  • Um cluster do Azure Databricks ou um SQL warehouse para se conectar ao DataGrip.

Etapa 1: Instalar o DataGrip

Baixar e instalar o DataGrip.

  • Linux: Baixe o arquivo .zip, extraia seu conteúdo e siga as instruções no arquivo Install-Linux-tar.txt.
  • MacOS: Baixe e execute o arquivo .dmg.
  • Windows: Baixe e execute o arquivo .exe.

Para obter mais informações, consulte Instalar o DataGrip no site do DataGrip.

Etapa 2: configurar o Driver JDBC do Databricks para DataGrip

Configure o DataGrip com informações sobre o Driver JDBC do Databricks que você baixou anteriormente.

  1. Inicie o DataGrip.
  2. Clique em Arquivo > Fontes de Dados.
  3. Na caixa de diálogo Fontes de Dados e Drivers, clique na guia Drivers.
  4. Clique no botão + (Driver) para adicionar um driver.
  5. Para Nome, insira Databricks.
  6. Na guia Geral, na lista Arquivos de Driver, clique no botão + (Adicionar).
  7. Clique em JARs Personalizados.
  8. Navegue até o arquivo DatabricksJDBC42.jar que você extraiu antes e selecione-o e clique em Abrir.
  9. Para Classe, selecione com.databricks.client.jdbc.Driver.
  10. Clique em OK.

Etapa 3: Conectar o DataGrip aos seus bancos de dados do Azure Databricks

  1. Em DataGrip, clique em Arquivo > Fontes de dados.

  2. Na guia Fontes de Dados, clique no botão + (Adicionar).

  3. Selecione o driver do Databricks que você adicionou na etapa anterior.

  4. Na guia Geral, para URL, insira o valor do campo URL do JDBC para o recurso Azure Databricks. Para obter a sintaxe do campo URL do JDBC, confira Configurações de autenticação para o Driver de JDBC do Databricks.

    Observação

    A ConnCatalog configuração de funcionalidade do driver deve ser especificada na URL JDBC, caso contrário, os esquemas não poderão ser identificados.

  5. Clique em Testar Conexão.

    Dica

    Você deve iniciar o recurso antes de testar sua conexão. Caso contrário, o teste pode demorar vários minutos para ser concluído enquanto o recurso é iniciado.

  6. Se a conexão for realizada com sucesso, na guia Esquemas, marque as caixas para os esquemas que você quer acessar, por exemplo, Todos os esquemas.

  7. Clique em OK.

Repita as instruções nessa etapa para cada recurso que você deseja que o DataGrip acesse.

Etapa 4: Usar o DataGrip para procurar tabelas

Use o DataGrip para acessar tabelas em seu workspace do Azure Databricks.

  1. No DataGrip, na janela Banco de dados, expanda seu nó de recurso, expanda o esquema que deseja navegar e, em seguida, expanda tabelas.
  2. Clique duas vezes em uma tabela. O primeiro conjunto de linhas da tabela é exibido.

Repita as instruções nesta etapa para acessar tabelas adicionais.

Para acessar tabelas em outros esquemas, na barra de ferramentas da janela Banco de dados, clique no ícone Propriedades da Fonte de Dados. Na caixa de diálogo Fontes de Dados e Drivers, na guia Esquemas, marque a caixa de cada esquema adicional que você deseja acessar e clique em OK.

Etapa 5: Usar o DataGrip para executar instruções SQL

Use o DataGrip para carregar a tabela trips de exemplo do esquema nyctaxi do catálogo samples.

  1. No DataGrip, clique em Arquivo > Novo > Arquivo SQL.

  2. Insira um nome para o arquivo, por exemplo select_trips.

  3. Na guia do arquivo select_trips.sql, insira a seguinte instrução SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Selecione a instrução SELECT.

  5. Na barra de ferramentas da guia arquivo, clique no ícone Executar.

Próximas etapas

Recursos adicionais