DBeaver-integrering med Azure Databricks
Kommentar
Den här artikeln beskriver DBeaver, som varken tillhandahålls eller stöds av Databricks. Information om hur du kontaktar providern finns på sidan Problem för lagringsplatsen dbeaver/dbeaver på GitHub.
DBeaver är ett lokalt databasverktyg för flera plattformar för utvecklare, databasadministratörer, dataanalytiker, datatekniker och andra som behöver arbeta med databaser. DBeaver stöder Både Azure Databricks och andra populära databaser.
Den här artikeln beskriver hur du använder din lokala utvecklingsdator för att installera, konfigurera och använda den kostnadsfria öppen källkod DBeaver Community Edition (CE) för att arbeta med databaser i Azure Databricks.
Kommentar
Den här artikeln har testats med macOS, Databricks JDBC Driver version 2.6.36 och DBeaver CE version 23.3.0.
Krav
Innan du installerar DBeaver måste den lokala utvecklingsdatorn uppfylla följande krav:
- Ett 64-bitars Linux-, macOS- eller Windows 64-bitars operativsystem. (Linux 32-bitars stöds men rekommenderas inte.)
- Databricks JDBC-drivrutinen till din lokala utvecklingsdator och extrahera
DatabricksJDBC42.jar
filen från den nedladdadeDatabricksJDBC42-<version>.zip
filen.
Du måste också ha ett Azure Databricks-kluster eller SQL-lager för att kunna ansluta till DBeaver.
Steg 1: Installera DBeaver
Ladda ned och installera DBeaver CE enligt följande:
- Linux: Ladda ned och kör en av Linux-installationsprogrammet från nedladdningssidan på DBeaver-webbplatsen.
snap
ochflatpak
installationsalternativ finns även på den här sidan. - macOS: Använd Homebrew för att köra
brew install --cask dbeaver-community
eller använd MacPorts för att körasudo port install dbeaver-community
. Ett macOS-installationsprogram finns också på sidan Ladda ned på DBeaver-webbplatsen. - Windows: Använd Chocolatey för att köra
choco install dbeaver
. Ett Windows-installationsprogram finns också på sidan Ladda ned på DBeaver-webbplatsen.
Steg 2: Konfigurera Azure Databricks JDBC-drivrutinen för DBeaver
Konfigurera DBeaver med information om Databricks JDBC-drivrutinen som du laddade ned tidigare.
- Starta DBeaver.
- Om du uppmanas att skapa en ny databas klickar du på Nej.
- Om du uppmanas att ansluta till eller välja en databas klickar du på Avbryt.
- Klicka på Databasdrivrutinshanteraren>.
- I dialogrutan Drivrutinshanterare klickar du på Ny.
- I dialogrutan Skapa ny drivrutin klickar du på fliken Bibliotek.
- Klicka på Lägg till fil.
- Navigera till mappen som du extraherade Azure Databricks JDBC-drivrutinen till.
- Navigera en nivå lägre för att hitta
.jar
filen. .jar
Markera filen och klicka på Öppna.- På fliken Inställningar anger du
Databricks
för Drivrutinsnamn . - På fliken Inställningar anger du
com.databricks.client.jdbc.Driver
för Klassnamn . - Klicka på OK.
- I dialogrutan Drivrutinshanteraren klickar du på Stäng.
Steg 3: Anslut DBeaver till dina Azure Databricks-databaser
Använd DBeaver för att ansluta till klustret eller SQL-lagret för att få åtkomst till databaserna på din Azure Databricks-arbetsyta.
I DBeaver klickar du på Databas > ny databas Anslut ion.
I dialogrutan Anslut till en databas klickar du på Databricks på fliken Alla och klickar sedan på Nästa.
Klicka på fliken Main och ange ett värde i fältet JDBC URL för din Azure Databricks-resurs. Fältsyntax för JDBC-URL finns i Autentiseringsinställningar för Databricks JDBC-drivrutinen.
Klicka på Testa anslutning.
Dricks
Du bör starta din Azure Databricks-resurs innan du testar anslutningen. Annars kan det ta flera minuter att slutföra testet medan resursen startar.
Om anslutningen lyckas klickar du på OK i dialogrutan Anslut ionstest.
I dialogrutan Anslut till en databas klickar du på Slutför.
I fönstret Databasnavigering visas en Databricks-post . Så här ändrar du anslutningens namn så att det blir lättare att identifiera:
- Högerklicka på Databricks och klicka sedan på Redigera Anslut ion.
- I dialogrutan Anslut ion-konfiguration klickar du på Allmänt.
- Ersätt med ett annat namn för anslutningen för Anslut ionsnamn
Databricks
. - Klicka på OK.
Upprepa anvisningarna i det här steget för varje resurs som du vill att DBeaver ska komma åt.
Steg 4: Använd DBeaver för att bläddra bland dataobjekt
Använd DBeaver för att komma åt dataobjekt på din Azure Databricks-arbetsyta, till exempel tabeller och tabellegenskaper, vyer, index, datatyper och andra typer av dataobjekt.
Högerklicka på den anslutning som du vill använda i fönstret Databasnavigering i DBeaver.
Om Anslut är aktiverat klickar du på det. (Om Anslut är inaktiverad är du redan ansluten.)
Dricks
Du bör starta resursen innan du försöker ansluta till den. Annars kan det ta flera minuter att slutföra anslutningen medan resursen startas.
Expandera den anslutning som du just har anslutit till.
Expandera och bläddra bland tillgängliga dataobjekt. Dubbelklicka på ett dataobjekt för att få mer information om det.
Upprepa anvisningarna i det här steget för att få åtkomst till ytterligare dataobjekt.
Steg 5: Använd DBeaver för att köra SQL-instruktioner
Använd DBeaver för att läsa in exempeltabellen trips
samples
från katalogens nyctaxi
schema.
Högerklicka på den anslutning som du vill använda i fönstret Databasnavigering i DBeaver.
Om Anslut är aktiverat klickar du på det. (Om Anslut är inaktiverad är du redan ansluten.)
Dricks
Du bör starta resursen innan du försöker ansluta till den. Annars kan det ta flera minuter att slutföra anslutningen medan resursen startas.
Klicka på SQL-redigeraren > Nytt SQL-skript.
På fliken (anslutningsnamn) Script-1 anger du den här SQL-instruktionen:
SELECT * FROM samples.nyctaxi.trips;
Klicka på SQL-redigeraren > Kör SQL-skript.
Nästa steg
- Använd databasobjektredigeraren för att arbeta med databasobjektegenskaper, data och entitetsrelationsdiagram.
- Använd dataredigeraren för att visa och redigera data i en databastabell eller vy.
- Använd SQL-redigeraren för att arbeta med SQL-skript.
- Arbeta med entitetsrelationsdiagram (ERD) i DBeaver.
- Importera och exportera data till och från DBeaver.
- Migrera data med DBeaver.
- Felsöka JDBC-drivrutinsproblem med DBeaver.