Integrace DataGrip s Azure Databricks

Poznámka:

Tento článek se zabývá službou DataGrip, která není poskytována ani podporována službou Databricks. Pokud chcete kontaktovat poskytovatele, přejděte na podporu DataGrip.

DataGrip je integrované vývojové prostředí (IDE) pro vývojáře databází, které poskytuje konzolu pro dotazy, navigaci schématem, vysvětlení plánů, inteligentní dokončování kódu, analýzu v reálném čase a rychlé opravy, refaktoringy, integraci správy verzí a další funkce.

Tento článek popisuje, jak pomocí místního vývojového počítače nainstalovat, nakonfigurovat a používat DataGrip k práci s databázemi v Azure Databricks.

Poznámka:

Tento článek byl testován s macOS, Ovladačem Databricks JDBC verze 2.6.36 a DataGrip verze 2023.3.1.

Požadavky

Před instalací DataGrip musí místní vývojový počítač splňovat následující požadavky:

  • Operační systém Linux, macOS nebo Windows.
  • Stáhněte ovladač Databricks JDBC do místního vývojového počítače a extrahujte DatabricksJDBC42.jar soubor ze staženého DatabricksJDBC42-<version>.zip souboru.
  • Cluster Azure Databricks nebo SQL Warehouse pro připojení pomocí Služby DataGrip

Krok 1: Instalace DataGrip

Stáhněte a nainstalujte DataGrip.

  • Linux: Stáhněte .zip si soubor, extrahujte jeho obsah a postupujte podle pokynů v Install-Linux-tar.txt souboru.
  • macOS: Stáhněte a spusťte .dmg soubor.
  • Windows: Stáhněte a spusťte .exe soubor.

Další informace naleznete v tématu Instalace DataGrip na webu DataGrip.

Krok 2: Konfigurace ovladače Databricks JDBC pro DataGrip

Nastavte DataGrip s informacemi o ovladači Databricks JDBC, který jste si stáhli dříve.

  1. Spusťte DataGrip.
  2. Klikněte na Zdroje dat souboru>.
  3. V dialogovém okně Zdroje dat a ovladače klikněte na kartu Ovladače .
  4. Kliknutím na + tlačítko (Ovladač) přidejte ovladač.
  5. Do pole Název zadejte Databricks.
  6. Na kartě Obecné klikněte v seznamu Soubory ovladačů na + tlačítko (Přidat).
  7. Klikněte na Vlastní žádosti o přijetí změn.
  8. Vyhledejte a vyberte DatabricksJDBC42.jar soubor, který jste extrahovali dříve, a potom klikněte na Otevřít.
  9. V případě třídy vyberte com.databricks.client.jdbc.Driver.
  10. Klikněte na OK.

Krok 3: Připojení DataGrip k databázím Azure Databricks

  1. V DataGrip klikněte na Soubor > zdroje dat.

  2. Na kartě Zdroje dat klikněte na + tlačítko (Přidat).

  3. Vyberte ovladač Databricks, který jste přidali v předchozím kroku.

  4. Na kartě Obecné zadejte pro adresu URL hodnotu pole adresy URL JDBC pro váš prostředek Azure Databricks. Syntaxi pole adresy URL JDBC najdete v tématu Nastavení ověřování pro ovladač Databricks JDBC.

    Poznámka:

    Nastavení ConnCatalog schopností ovladače musí být zadáno na adrese URL JDBC, jinak nelze identifikovat schémata.

  5. Klikněte na Otestovat připojení.

    Tip

    Před testováním připojení byste měli spustit prostředek. Jinak může dokončení testu trvat několik minut, než se prostředek spustí.

  6. Pokud připojení proběhne úspěšně, na kartě Schémata zaškrtněte políčka pro schémata, ke kterým chcete mít přístup, například Všechna schémata.

  7. Klikněte na OK.

Opakujte pokyny v tomto kroku pro každý prostředek, ke kterému má DataGrip přístup.

Krok 4: Procházení tabulek pomocí DataGrip

K přístupu k tabulkám v pracovním prostoru Azure Databricks použijte DataGrip.

  1. V DataGrip v okně Databáze rozbalte uzel prostředku, rozbalte schéma, které chcete procházet, a potom rozbalte tabulky.
  2. Poklikejte na tabulku. Zobrazí se první sada řádků z tabulky.

Pokud chcete získat přístup k dalším tabulkám, opakujte pokyny v tomto kroku.

Pokud chcete získat přístup k tabulkám v jiných schématech, klikněte na panelu nástrojů okna Databáze na ikonu Vlastnosti zdroje dat. V dialogovém okně Zdroje dat a ovladače na kartě Schémata zaškrtněte políčko pro každé další schéma, ke které chcete získat přístup, a klepněte na tlačítko OK.

Krok 5: Použití DataGrip ke spuštění příkazů SQL

Použijte DataGrip k načtení ukázkové trips tabulky ze schématu samples nyctaxi katalogu.

  1. V Nástroji DataGrip klikněte na soubor > Nový > soubor SQL.

  2. Zadejte název souboru, například select_trips.

  3. Na select_trips.sql kartě soubor zadejte následující příkaz SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Vyberte příkaz SELECT .

  5. Na panelu nástrojů na kartě soubor klikněte na ikonu Spustit .

Další kroky

Další materiály