Integrace DBeaveru s Azure Databricks

Poznámka:

Tento článek popisuje DBeaver, který není poskytován ani podporován Databricks. Pokud chcete kontaktovat poskytovatele, podívejte se na stránku Problémy v úložišti dbeaver/dbeaver na GitHubu.

DBeaver je místní databázový nástroj pro více platforem pro vývojáře, správce databází, datové analytiky, datové inženýry a další, kteří potřebují pracovat s databázemi. DBeaver podporuje Azure Databricks i další oblíbené databáze.

Tento článek popisuje, jak pomocí místního vývojového počítače nainstalovat, nakonfigurovat a používat bezplatný open source DBeaver Community Edition (CE) pro práci s databázemi v Azure Databricks.

Poznámka:

Tento článek byl testován s macOS, Ovladačem Databricks JDBC verze 2.6.36 a DBeaver CE verze 23.3.0.

Požadavky

Před instalací DBeaveru musí místní vývojový počítač splňovat následující požadavky:

  • 64bitový operační systém Linux, macOS nebo Windows 64bitový. (Linux 32bitová verze se podporuje, ale nedoporučuje se.)
  • Ovladač Databricks JDBC na místním vývojovém počítači extrahuje DatabricksJDBC42.jar soubor ze staženého DatabricksJDBC42-<version>.zip souboru.

K připojení pomocí DBeaveru musíte mít také cluster Azure Databricks nebo SQL Warehouse.

Krok 1: Instalace DBeaveru

Stáhněte a nainstalujte DBeaver CE následujícím způsobem:

  • Linux: Stáhněte a spusťte jeden z instalačních programů Pro Linux ze stránky Stáhnout na webu DBeaver. snap na flatpak této stránce jsou k dispozici také možnosti instalace.
  • macOS: Spusťte homebrew brew install --cask dbeaver-communitynebo použijte MacPorts ke spuštění sudo port install dbeaver-community. Instalační program pro macOS je k dispozici také na stránce pro stažení na webu DBeaver.
  • Windows: Použití Chocolatey ke spuštění choco install dbeaver. Instalační služba systému Windows je také k dispozici na stránce Ke stažení na webu DBeaver.

Krok 2: Konfigurace ovladače Azure Databricks JDBC pro DBeaver

Nastavte DBeaver s informacemi o ovladači Databricks JDBC, který jste si stáhli dříve.

  1. Spusťte DBeaver.
  2. Pokud se zobrazí výzva k vytvoření nové databáze, klikněte na tlačítko Ne.
  3. Pokud se zobrazí výzva k připojení k databázi nebo ji vyberte, klikněte na tlačítko Storno.
  4. Klikněte na Správce ovladačů databáze>.
  5. V dialogovém okně Správce ovladačů klepněte na tlačítko Nový.
  6. V dialogovém okně Vytvořit nový ovladač klikněte na kartu Knihovny .
  7. Klikněte na Přidat soubor.
  8. Přejděte do složky, do které jste extrahovali ovladač Azure Databricks JDBC.
  9. Pokud chcete soubor najít .jar , přejděte o jednu úroveň níže.
  10. .jar Zvýrazněte soubor a klikněte na Otevřít.
  11. Na kartě Nastavení zadejte Databricksjako název ovladače .
  12. Na kartě Nastavení zadejte jako com.databricks.client.jdbc.Drivernázev třídy .
  13. Klikněte na OK.
  14. V dialogovém okně Správce ovladačů klepněte na tlačítko Zavřít.

Krok 3: Připojení DBeaver k databázím Azure Databricks

Pomocí DBeaveru se připojte ke clusteru nebo SQL Warehouse a získejte přístup k databázím v pracovním prostoru Azure Databricks.

  1. V nástroji DBeaver klepněte na položku Database > New Database Připojení ion.

  2. V dialogovém okně Připojení do databáze klikněte na kartě Vše na Databricks a potom klikněte na Tlačítko Další.

  3. Klikněte na kartu Hlavní a zadejte hodnotu do pole adresy URL JDBC pro váš prostředek Azure Databricks. Syntaxi pole adresy URL JDBC najdete v tématu Nastavení ověřování pro ovladač Databricks JDBC.

  4. Klikněte na Otestovat připojení.

    Tip

    Před testováním připojení byste měli spustit prostředek Azure Databricks. Jinak může dokončení testu trvat několik minut, než se prostředek spustí.

  5. Pokud připojení proběhne úspěšně, v dialogovém okně Připojení ion Test klepněte na tlačítko OK.

  6. V dialogovém okně Připojení do databáze klepněte na tlačítko Dokončit.

V okně Navigátor databáze se zobrazí položka Databricks. Pokud chcete změnit název připojení, aby bylo snazší ho identifikovat:

  1. Klikněte pravým tlačítkem na Databricks a potom klikněte na upravit Připojení ion.
  2. V dialogovém okně konfigurace Připojení klepněte na tlačítko Obecné.
  3. Jako název Připojení nahraďte Databricks jiným názvem připojení.
  4. Klikněte na OK.

Opakujte pokyny v tomto kroku pro každý prostředek, ke kterému má DBeaver přistupovat.

Krok 4: Procházení datových objektů pomocí DBeaveru

Pomocí DBeaveru můžete přistupovat k datovým objektům v pracovním prostoru Azure Databricks, jako jsou tabulky a vlastnosti tabulky, zobrazení, indexy, datové typy a další datové objekty.

  1. V nástroji DBeaver klikněte v okně Navigátor databáze pravým tlačítkem myši na připojení, které chcete použít.

  2. Pokud je Připojení povolená, klikněte na něj. (Pokud Připojení je zakázaná, už jste připojení.)

    Tip

    Než se k němu pokusíte připojit, měli byste spustit prostředek. Jinak může dokončení připojení trvat několik minut, než se prostředek spustí.

  3. Rozbalte připojení, ke kterému jste právě připojení připojili.

  4. Rozbalení a procházení dostupných datových objektů Poklikáním na datový objekt získáte další informace o něm.

Opakujte pokyny v tomto kroku, abyste získali přístup k dalším datovým objektům.

Krok 5: Spuštění příkazů SQL pomocí DBeaveru

Pomocí DBeaveru načtěte ukázkovou trips tabulku ze schématu samples nyctaxi katalogu.

  1. V nástroji DBeaver klikněte v okně Navigátor databáze pravým tlačítkem myši na připojení, které chcete použít.

  2. Pokud je Připojení povolená, klikněte na něj. (Pokud Připojení je zakázaná, už jste připojení.)

    Tip

    Než se k němu pokusíte připojit, měli byste spustit prostředek. Jinak může dokončení připojení trvat několik minut, než se prostředek spustí.

  3. Klikněte na nový skript SQL Editoru > SQL.

  4. Na kartě Script-1 (název připojení) zadejte tento příkaz SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. Klepněte na tlačítko SQL Editor > Spustit skript SQL.

Další kroky

  • Pomocí editoru objektů databáze můžete pracovat s vlastnostmi databázového objektu, daty a diagramy relací entit.
  • Pomocí editoru dat můžete zobrazit a upravit data v tabulce nebo zobrazení databáze.
  • Pomocí editoru SQL můžete pracovat se skripty SQL.
  • Práce s diagramy relací entit (ERD) v DBeaveru
  • Importujte a exportujte data do A z DBeaveru.
  • Migrace dat pomocí DBeaveru
  • Řešení potíží s ovladačem JDBC s DBeaverem

Další materiály