Eseguire il debug del codice usando Databricks Connect per l'estensione Databricks per Visual Studio Code

Questo articolo descrive come usare l'integrazione di Databricks Connect nell'estensione Databricks per Visual Studio Code per eseguire ed eseguire il debug di singoli file Python (.py). Vedere Che cos'è l'estensione Databricks per Visual Studio Code?.

L'integrazione di Databricks Connect consente anche di eseguire ed eseguire il debug delle celle del notebook. Vedere Eseguire ed eseguire il debug delle celle del notebook con Databricks Connect usando l'estensione Databricks per Visual Studio Code.

Requisiti

Prima di poter usare Databricks Connect dall'interno dell'estensione Databricks per Visual Studio Code, è necessario prima soddisfare i requisiti di Databricks Connect. Questi requisiti includono elementi come un'area di lavoro abilitata per il catalogo unity, i requisiti di calcolo e i requisiti di versione per l'installazione locale di Python.

Attivare un ambiente virtuale Python

Attivare un ambiente virtuale Python per il progetto Python. Gli ambienti virtuali Python consentono di assicurarsi che il progetto usi versioni compatibili dei pacchetti Python e Python (in questo caso, il pacchetto Databricks Connect).

Nel riquadro Configurazione:

  1. Fare clic sull'elemento rosso Attiva ambiente virtuale in Ambiente Python.
  2. Nel riquadro comandi selezionare Venv o Conda.
  3. Selezionare le dipendenze da installare, se presenti.

Installare Databricks Connect

Nella visualizzazione Configurazione in Ambiente Python:

  1. Fare clic sul pulsante rosso Installa databricks-connect play.
  2. Collegare un cluster.
    • Se la sezione Cluster non è già configurata nell'estensione, viene visualizzato il messaggio seguente: "Collegare un cluster per usare Databricks Connect". Fare clic su Collega cluster e selezionare un cluster che soddisfi i requisiti di Databricks Connect.
    • Se la sezione Cluster è configurata ma il cluster non è compatibile con Databricks Connect, fare clic sul pulsante rosso Databricks Connect disabilitato , fare clic su Collega cluster e selezionare un cluster compatibile.
  3. Se il pacchetto Databricks Connect (e le relative dipendenze) non sono già installati, viene visualizzato il messaggio seguente: "Per il debug interattivo e il completamento automatico è necessario Databricks Connect. Si vuole installarlo nell'ambiente <environment-name>". Fare clic su Installa.
  4. Nella barra di stato di Visual Studio Code, se viene visualizzato il pulsante rosso Databricks Connect disabilitato , fare clic su di esso e completare le istruzioni visualizzate per abilitarlo.
  5. Dopo aver visualizzato il pulsante Databricks Connect abilitato , è ora possibile usare Databricks Connect.

Nota

Se si usa Poetry, è possibile sincronizzare i pyproject.toml file e poetry.lock con il pacchetto Databricks Connect installato (e le relative dipendenze) eseguendo il comando seguente. Assicurarsi di sostituire 13.3.2 con la versione del pacchetto Databricks Connect corrispondente a quello installato dall'estensione Databricks per Visual Studio Code per il progetto.

poetry add databricks-connect==13.3.2

Eseguire o eseguire il debug del codice Python

Dopo aver abilitato Databricks Connect, eseguire o eseguire il debug del file Python (.py):

  1. Nel progetto aprire il file Python che si vuole eseguire o eseguire il debug.

  2. Impostare eventuali punti di interruzione di debug all'interno del file Python.

  3. Fare clic sull'icona Esegui in Databricks accanto all'elenco delle schede dell'editor e quindi fare clic su Databricks Connect: Debug file corrente.

    Eseguire il debug del file corrente dall'icona

    L'output viene visualizzato nel riquadro Console di debug.

    È anche possibile fare clic con il pulsante destro del mouse sul .py file e quindi scegliere Esegui in Databricks Databricks>Connect: Debug file corrente.

    Eseguire il debug del file corrente dal menu di scelta rapida