Spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code
Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.
Poznámka:
Tato funkce funguje s Modulem Databricks Runtime 13.3 a novějším.
Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.
Spouštění buněk poznámkového bloku Pythonu
U poznámkových bloků s názvy souborů, které mají příponu .py
, se při otevření poznámkového bloku v integrovaném vývojovém prostředí sady Visual Studio Code zobrazí v každé buňce tlačítka Spustit buňku, Spustit nad a Ladicí buňka . Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.
Poznámkové bloky s názvy souborů, které mají .ipynb
rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a práce s buňkami kódu v Editoru poznámkových bloků.
Další informace o formátech poznámkových bloků pro názvy souborů a .ipynb
.py
rozšíření najdete v tématu Export a import poznámkových bloků Databricks.
Spuštění buněk poznámky Jupyter v Pythonu
Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb
):
V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu
.ipynb
.Tip
Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.
Kliknutím na Spustit všechny buňky spustíte všechny buňky bez ladění, spustíte buňku tak, aby spustila jednotlivou odpovídající buňku bez ladění, nebo spuštěním po řádku spusťte jednotlivé buňky po řádku s omezeným laděním s proměnnými hodnotami zobrazenými na panelu Jupyter (Zobrazit > otevřené zobrazení > Jupyter).
Chcete-li provést úplné ladění v jednotlivých buňkách, nastavte zarážky a v nabídce vedle tlačítka Spustit buňku klepněte na příkaz Ladit buňku.
Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.
Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.
Globální poznámkové bloky
Jsou povoleny také následující globální poznámkové bloky:
spark
, představující instanci objektudatabricks.connect.DatabricksSession
, je předem nakonfigurovaný tak, aby vytvořil instanciDatabricksSession
získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. PokudDatabricksSession
už je v kódu buňky poznámkového bloku vytvořena instance, použije se totoDatabricksSession
nastavení. Podívejte se na příklady kódu pro Databricks Connect pro Python.udf
, předkonfigurováno jako alias propyspark.sql.functions.udf
, což je alias pro uživatelem definované uživatelem Pythonu. Viz pyspark.sql.functions.udf.sql
, předkonfigurováno jako alias prospark.sql
.spark
, jak je popsáno výše, představuje předkonfigurovanou instancidatabricks.connect.DatabricksSession
. Viz Spark SQL.dbutils
, předkonfigurováno jako instance nástrojů Databricks, která se importuje adatabricks-sdk
vytvoří instanci získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. Viz Použití nástrojů Databricks.Poznámka:
Poznámkové bloky s Databricks Connect podporují jenom podmnožinu nástrojů Databricks.
Pokud chcete povolit
dbutils.widgets
, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install 'databricks-sdk[notebook]'
display
, předkonfigurováno jako alias pro předdefinovanýIPython.display.display
Jupyter . Viz IPython.display.display.displayHTML
, předkonfigurováno jako alias prodbruntime.display.displayHTML
, což je alias prodisplay.HTML
zipython
. Viz IPython.display.html.
Kouzelné poznámkové bloky
Jsou povoleny také následující magicky poznámkového bloku:
%fs
, což je stejné jako volánídbutils.fs
. Viz jazyky mixu.%sh
, který spustí příkaz pomocí magie%%script
buňky na místním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.%md
a%md-sandbox
, který spouští magii%%markdown
buňky . Viz jazyky mixu.%sql
, který běžíspark.sql
. Viz jazyky mixu.%pip
, který běžípip install
na místním počítači. To se nespustípip install
ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí příkazů %pip.%run
, který spouští jiný poznámkový blok. Viz Spuštění poznámkového bloku Databricks z jiného poznámkového bloku.Poznámka:
Pokud chcete povolit
%run
, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:pip install nbformat
Mezi další funkce, které jsou povolené, patří:
- Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu tabulky Jupyter.
Omezení
Omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code zahrnují:
- Poznámkové bloky magics a
%scala
nejsou podporovány%r
a zobrazují chybu, pokud je volána. Viz jazyky mixu. - Magic
%sql
poznámkového bloku nepodporuje některé příkazy DML, například Zobrazit tabulky.