Conectar a sistemas externos
O Azure Databricks fornece integrações internas a muitos sistemas de dados nativos de nuvem, bem como suporte extensível de JDBC para se conectar a outros sistemas de dados.
Os conectores documentados nesta seção concentram-se principalmente na configuração de uma conexão com uma única tabela no sistema de dados externo. Você também pode usar alguns desses drivers para gravar dados em sistemas externos.
Para conexões de dados somente leitura, o Databricks recomenda usar a Lakehouse Federation, que permite sincronizar bancos de dados inteiros com o Azure Databricks de sistemas externos e é regido pelo Catálogo do Unity. Confira O que é Federação do Lakehouse?.
O Partner Connect também fornece integrações a muitos sistemas de dados corporativos populares. Muitas soluções do Partner Connect não só se conectam a fontes de dados, mas também facilitam o ETL fácil para manter os dados em seu lakehouse atualizados. Consulte O que é o Databricks Partner Connect?.
Quais fontes de dados se conectam ao Azure Databricks com o JDBC?
Você pode usar o JDBC para se conectar a várias fontes de dados. O Databricks Runtime inclui drivers para vários bancos de dados JDBC, mas talvez seja necessário instalar um driver ou uma versão diferente do driver para se conectar ao banco de dados preferido. Os bancos de dados com suporte incluem o seguinte:
- Consultar o PostgreSQL com o Azure Databricks
- Consultar o MySQL com o Azure Databricks
- Consultar o MariaDB com o Azure Databricks
- Consultar o SQL Server com o Azure Databricks
- Use o conector do Azure Databricks para se conectar a outro workspace do Azure Databricks
Com quais serviços de dados o Azure Databricks se integra?
Os serviços de dados a seguir exigem que você defina as configurações de conexão, credenciais de segurança e configurações de rede. Você pode precisar de privilégios de administrador ou usuário avançado em sua conta do Azure ou no workspace do Azure Databricks. Algumas também exigem que você crie uma biblioteca do Azure Databricks e instale-a em um cluster: