Vývojářské nástroje

Databricks poskytuje ekosystém nástrojů, které vám pomůžou vyvíjet aplikace a řešení, které se integrují s Azure Databricks a programově spravují prostředky a data Databricks.

Tento článek obsahuje přehled těchto nástrojů a doporučení pro nejlepší nástroje pro běžné scénáře vývojářů.

Jaké nástroje databricks poskytuje vývojářům?

Následující tabulka obsahuje seznam vývojářských nástrojů, které poskytuje Databricks.

Nástroj Popis
Ověřování a autorizace Nakonfigurujte ověřování a autorizaci pro vaše nástroje, skripty a aplikace pro práci s Azure Databricks.
Databricks Connect Připojte se k Azure Databricks pomocí oblíbených integrovaných vývojových prostředí (IDE), jako jsou PyCharm, IntelliJ IDEA, Eclipse, RStudio a JupyterLab.

Pokud používáte Visual Studio Code, Databricks doporučuje rozšíření Databricks pro Visual Studio Code, které je postavené na databricks Connect, protože poskytuje další funkce, které umožňují snadnější konfiguraci.
Rozšíření Databricks pro Visual Studio Code Připojte se ke vzdáleným pracovním prostorům Azure Databricks z integrovaného vývojového prostředí (IDE) editoru Visual Studio Code .
Modul plug-in PyCharm Databricks Nakonfigurujte připojení ke vzdálenému pracovnímu prostoru Databricks a spusťte soubory v clusterech Databricks z PyCharm. Tento modul plug-in je vyvinut a poskytován JetBrains ve spolupráci s Databricks.
Sady SDK Databricks Automatizujte Azure Databricks z knihoven kódu napsaných pro oblíbené jazyky, jako jsou Python, Java, Go a R. Místo přímého odesílání volání rozhraní REST API pomocí nástroje curl/ Postman můžete použít sadu SDK k interakci s Databricks pomocí programovacího jazyka podle vašeho výběru.
Ovladače a nástroje SQL Připojte se k Azure Databricks, abyste mohli spouštět příkazy a skripty SQL, pracovat programově s Azure Databricks a integrovat funkce SQL Azure Databricks do aplikací psaných v oblíbených jazycích, jako je Python, Go, JavaScript a TypeScript.
Databricks CLI Přístup k funkcím Azure Databricks pomocí rozhraní příkazového řádku Databricks (CLI). Rozhraní příkazového řádku zabalí rozhraní REST API Databricks, takže místo odesílání volání rozhraní REST API přímo pomocí nástroje curl nebo Postman můžete k interakci s Databricks použít rozhraní příkazového řádku Databricks.
Sady prostředků Databricks Implementace osvědčených postupů pro vývoj, testování a nasazení (CI/CD) pro vaše projekty Azure Databricks a AI s využitím sad prostředků Databricks
Zprostředkovatel Terraformu Databricks a Terraform CDKTF pro Databricks Zřiďte infrastrukturu a prostředky Azure Databricks pomocí Terraformu.
Poskytovatel prostředků Pulumi Databricks Zřiďte infrastrukturu a prostředky Azure Databricks pomocí infrastruktury Pulumi jako kódu (IaC).
Nástroje CI/CD Integrujte oblíbené systémy a architektury CI/CD, jako jsou GitHub Actions, Jenkins a Apache Airflow.

Tip

K clusterům a skladům SQL pro přístup k datům v Azure Databricks můžete také připojit mnoho dalších oblíbených nástrojů třetích stran. Podívejte se na technologické partnery.

Který vývojářský nástroj mám použít?

Následující tabulka popisuje doporučení nástrojů Databricks pro běžné scénáře vývojářů.

Scénáře Doporučení
– Interaktivní vývoj a ladění z místního integrovaného vývojového prostředí (IDE) Rozšíření Databricks pro Visual Studio Code

Modul plug-in PyCharm Databricks

V případě jiných prostředí ID použijte rozhraní příkazového řádku Databricks s Databricks Connect.
– Přímá interakce s Databricks z příkazového řádku
– Skriptování prostředí
-Experimentování
– Přímé vyvolání rozhraní REST API
– Správa místních ověřovacích profilů
– Synchronizace kódu z integrovaného vývojového prostředí (IDE) do pracovního prostoru Databricks
Databricks CLI
– Správa pracovních postupů a nasazení projektů do Databricks
– Použití osvědčených postupů CI/CD
– Spoluvlastník, spoluvytáč, spoluvytáčujte prostředky a prostředky jako jednu jednotku.
- Podporuje nejběžnější prostředky.
Sady prostředků Databricks (funkce rozhraní příkazového řádku)
– Infrastruktura jako kód, CI/CD
– Správa a vytváření pracovních prostorů, katalogů, metastorů a vynucení oprávnění
- Záruka přenositelnosti prostředí a zotavení po havárii
– Mnoho podporovaných prostředků
Poskytovatel Terraformu pro Databricks
- Vývoj aplikací
- Integrace se stávajícími systémy nasazení
– Vytváření vlastních pracovních postupů Databricks a nových webových služeb
Databricks Python SDK

Databricks Java SDK

Databricks Go SDK

Databricks R SDK
– Pouze pokročilé scénáře
– Téměř všechny prostředky Databricks jsou k dispozici.
Databricks REST API