Spouštění a ladění buněk poznámkového bloku pomocí Databricks Connect pomocí rozšíření Databricks pro Visual Studio Code

Můžete spouštět a ladit poznámkové bloky, jednu buňku najednou nebo všechny buňky najednou a zobrazit výsledky v uživatelském rozhraní editoru Visual Studio Code pomocí rozšíření Databricks pro integraci nástroje Visual Studio Code Databricks Connect. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

Poznámka:

Tato funkce funguje s Modulem Databricks Runtime 13.3 a novějším.

Pokud chcete povolit integraci Databricks Connect pro poznámkové bloky v rozšíření Databricks pro Visual Studio Code, musíte databricks Connect nainstalovat v rozšíření Databricks pro Visual Studio Code. Viz Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.

Spouštění buněk poznámkového bloku Pythonu

U poznámkových bloků s názvy souborů, které mají příponu .py , se při otevření poznámkového bloku v integrovaném vývojovém prostředí sady Visual Studio Code zobrazí v každé buňce tlačítka Spustit buňku, Spustit nad a Ladicí buňka . Při spuštění buňky se její výsledky zobrazí na samostatné kartě integrovaného vývojového prostředí (IDE). Při ladění se v laděné buňce zobrazují tlačítka Pokračovat, Zastavit a Krokovat . Při ladění buňky můžete použít funkce ladění editoru Visual Studio Code, jako je sledování stavů proměnných a zobrazení zásobníku volání a konzoly ladění.

Poznámkové bloky s názvy souborů, které mají .ipynb rozšíření, obsahují při otevření poznámkového bloku v integrovaném vývojovém prostředí editoru Visual Studio Code poznámkový blok a jeho buňky další funkce. Viz Spuštění buněk a práce s buňkami kódu v Editoru poznámkových bloků.

Další informace o formátech poznámkových bloků pro názvy souborů a .ipynb .py rozšíření najdete v tématu Export a import poznámkových bloků Databricks.

Spuštění buněk poznámky Jupyter v Pythonu

Spuštění nebo ladění poznámkového bloku Jupyter v Pythonu (.ipynb):

  1. V projektu otevřete poznámkový blok Jupyter Pythonu, který chcete spustit nebo ladit. Ujistěte se, že soubor Pythonu je ve formátu poznámkového bloku Jupyter a má příponu .ipynb.

    Tip

    Nový poznámkový blok Jupyter v Pythonu můžete vytvořit spuštěním >příkazu Create: New Jupyter Notebook z palety příkazů.

  2. Kliknutím na Spustit všechny buňky spustíte všechny buňky bez ladění, spustíte buňku tak, aby spustila jednotlivou odpovídající buňku bez ladění, nebo spuštěním po řádku spusťte jednotlivé buňky po řádku s omezeným laděním s proměnnými hodnotami zobrazenými na panelu Jupyter (Zobrazit > otevřené zobrazení > Jupyter).

    Chcete-li provést úplné ladění v jednotlivých buňkách, nastavte zarážky a v nabídce vedle tlačítka Spustit buňku klepněte na příkaz Ladit buňku.

    Po kliknutí na některou z těchto možností se může zobrazit výzva k instalaci chybějících závislostí balíčku poznámkového bloku Jupyter v Pythonu. Kliknutím ho nainstalujte.

    Další informace najdete v poznámkových blocích Jupyter v editoru VS Code.

Globální poznámkové bloky

Jsou povoleny také následující globální poznámkové bloky:

  • spark, představující instanci objektu databricks.connect.DatabricksSession, je předem nakonfigurovaný tak, aby vytvořil instanci DatabricksSession získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. Pokud DatabricksSession už je v kódu buňky poznámkového bloku vytvořena instance, použije se toto DatabricksSession nastavení. Podívejte se na příklady kódu pro Databricks Connect pro Python.

  • udf, předkonfigurováno jako alias pro pyspark.sql.functions.udf, což je alias pro uživatelem definované uživatelem Pythonu. Viz pyspark.sql.functions.udf.

  • sql, předkonfigurováno jako alias pro spark.sql. spark, jak je popsáno výše, představuje předkonfigurovanou instanci databricks.connect.DatabricksSession. Viz Spark SQL.

  • dbutils, předkonfigurováno jako instance nástrojů Databricks, která se importuje a databricks-sdk vytvoří instanci získáním přihlašovacích údajů pro ověřování Azure Databricks z rozšíření. Viz Použití nástrojů Databricks.

    Poznámka:

    Poznámkové bloky s Databricks Connect podporují jenom podmnožinu nástrojů Databricks.

    Pokud chcete povolit dbutils.widgets, musíte nejprve nainstalovat sadu Databricks SDK pro Python spuštěním následujícího příkazu v terminálu místního vývojového počítače:

    pip install 'databricks-sdk[notebook]'
    
  • display, předkonfigurováno jako alias pro předdefinovaný IPython.display.displayJupyter . Viz IPython.display.display.

  • displayHTML, předkonfigurováno jako alias pro dbruntime.display.displayHTML, což je alias pro display.HTML z ipython. Viz IPython.display.html.

Kouzelné poznámkové bloky

Jsou povoleny také následující magicky poznámkového bloku:

  • %fs, což je stejné jako volání dbutils.fs . Viz jazyky mixu.

  • %sh, který spustí příkaz pomocí magie %%script buňky na místním počítači. Tento příkaz se nespustí ve vzdáleném pracovním prostoru Azure Databricks. Viz jazyky mixu.

  • %md a %md-sandbox, který spouští magii %%markdownbuňky . Viz jazyky mixu.

  • %sql, který běží spark.sql. Viz jazyky mixu.

  • %pip, který běží pip install na místním počítači. To se nespustí pip install ve vzdáleném pracovním prostoru Azure Databricks. Viz Správa knihoven pomocí příkazů %pip.

  • %run, který spouští jiný poznámkový blok. Viz Spuštění poznámkového bloku Databricks z jiného poznámkového bloku.

    Poznámka:

    Pokud chcete povolit %run, musíte nejprve nainstalovat knihovnu nbformat spuštěním následujícího příkazu v terminálu místního vývojového počítače:

    pip install nbformat
    

Mezi další funkce, které jsou povolené, patří:

  • Datové rámce Sparku se převedou na datové rámce pandas, které se zobrazují ve formátu tabulky Jupyter.

Omezení

Omezení spouštění buněk v poznámkových blocích v editoru Visual Studio Code zahrnují:

  • Poznámkové bloky magics a %scala nejsou podporovány %r a zobrazují chybu, pokud je volána. Viz jazyky mixu.
  • Magic %sql poznámkového bloku nepodporuje některé příkazy DML, například Zobrazit tabulky.