Integração do DataGrip ao Azure Databricks
Observação
Este artigo aborda o DataGrip, que não é fornecido nem tem suporte do Databricks. Para entrar em contato com o provedor, confira o Suporte do DataGrip.
DataGrip é um ambiente de desenvolvimento integrado (IDE) para desenvolvedores de banco de dados que fornece um console de consulta, navegação de esquema, planos de explicação, conclusão de código inteligente, análise em tempo real e correções rápidas, refatoração, integração de controle de versão e outros recursos.
Este artigo descreve como usar o computador de desenvolvimento local para instalar, configurar e usar o DataGrip para trabalhar com bancos de dados no Azure Databricks.
Observação
Este artigo foi testado com o macOS, Databricks JDBC Driver versão 2.6.36 e DataGrip versão 2023.3.1.
Requisitos
Antes de instalar o DataGrip, o computador de desenvolvimento local deve atender aos seguintes requisitos:
- Um sistema operacional Linux, macOS ou Windows.
- Baixe o Driver JDBC do Databricks no computador de desenvolvimento local, extraindo o arquivo
DatabricksJDBC42.jar
do arquivoDatabricksJDBC42-<version>.zip
baixado. - Um cluster do Azure Databricks ou um SQL warehouse para se conectar ao DataGrip.
Etapa 1: Instalar o DataGrip
Baixar e instalar o DataGrip.
- Linux: Baixe o arquivo
.zip
, extraia seu conteúdo e siga as instruções no arquivoInstall-Linux-tar.txt
. - MacOS: Baixe e execute o arquivo
.dmg
. - Windows: Baixe e execute o arquivo
.exe
.
Para obter mais informações, consulte Instalar o DataGrip no site do DataGrip.
Etapa 2: configurar o Driver JDBC do Databricks para DataGrip
Configure o DataGrip com informações sobre o Driver JDBC do Databricks que você baixou anteriormente.
- Inicie o DataGrip.
- Clique em Arquivo > Fontes de Dados.
- Na caixa de diálogo Fontes de Dados e Drivers, clique na guia Drivers.
- Clique no botão + (Driver) para adicionar um driver.
- Para Nome, insira
Databricks
. - Na guia Geral, na lista Arquivos de Driver, clique no botão + (Adicionar).
- Clique em JARs Personalizados.
- Navegue até o arquivo
DatabricksJDBC42.jar
que você extraiu antes e selecione-o e clique em Abrir. - Para Classe, selecione
com.databricks.client.jdbc.Driver
. - Clique em OK.
Etapa 3: Conectar o DataGrip aos seus bancos de dados do Azure Databricks
Em DataGrip, clique em Arquivo > Fontes de dados.
Na guia Fontes de Dados, clique no botão + (Adicionar).
Selecione o driver do Databricks que você adicionou na etapa anterior.
Na guia Geral, para URL, insira o valor do campo URL do JDBC para o recurso Azure Databricks. Para obter a sintaxe do campo URL do JDBC, confira Configurações de autenticação para o Driver de JDBC do Databricks.
Observação
A
ConnCatalog
configuração de funcionalidade do driver deve ser especificada na URL JDBC, caso contrário, os esquemas não poderão ser identificados.Clique em Testar Conexão.
Dica
Você deve iniciar o recurso antes de testar sua conexão. Caso contrário, o teste pode demorar vários minutos para ser concluído enquanto o recurso é iniciado.
Se a conexão for realizada com sucesso, na guia Esquemas, marque as caixas para os esquemas que você quer acessar, por exemplo, Todos os esquemas.
Clique em OK.
Repita as instruções nessa etapa para cada recurso que você deseja que o DataGrip acesse.
Etapa 4: Usar o DataGrip para procurar tabelas
Use o DataGrip para acessar tabelas em seu workspace do Azure Databricks.
- No DataGrip, na janela Banco de dados, expanda seu nó de recurso, expanda o esquema que deseja navegar e, em seguida, expanda tabelas.
- Clique duas vezes em uma tabela. O primeiro conjunto de linhas da tabela é exibido.
Repita as instruções nesta etapa para acessar tabelas adicionais.
Para acessar tabelas em outros esquemas, na barra de ferramentas da janela Banco de dados, clique no ícone Propriedades da Fonte de Dados. Na caixa de diálogo Fontes de Dados e Drivers, na guia Esquemas, marque a caixa de cada esquema adicional que você deseja acessar e clique em OK.
Etapa 5: Usar o DataGrip para executar instruções SQL
Use o DataGrip para carregar a tabela trips
de exemplo do esquema nyctaxi
do catálogo samples
.
No DataGrip, clique em Arquivo > Novo > Arquivo SQL.
Insira um nome para o arquivo, por exemplo
select_trips
.Na guia do arquivo
select_trips.sql
, insira a seguinte instrução SQL:SELECT * FROM samples.nyctaxi.trips;
Selecione a instrução
SELECT
.Na barra de ferramentas da guia arquivo, clique no ícone Executar.
Próximas etapas
- Saiba mais sobre o Console de consulta no DataGrip.
- Saiba mais sobre o Editor de dados no DataGrip.
- Saiba mais sobre o as janela de ferramentas no DataGrip.
- Saiba como pesquisar no DataGrip.
- Saiba como exportar dados no DataGrip.
- Saiba como localizar e substituir texto usando expressões regulares no DataGrip.