Che cos’è l’estensione Databricks per Visual Studio Code?
L'estensione Databricks per Visual Studio Code consente di connettersi alle aree di lavoro remote di Azure Databricks dall'ambiente di sviluppo integrato (IDE) di Visual Studio Code in esecuzione nel computer di sviluppo locale. È quindi possibile:
- Definire, implementare ed eseguire bundle di asset di Databricks per applicare modelli CI/CD e procedure consigliate ai processi di Azure Databricks, alle pipeline delle tabelle live Delta e agli stack MLOps usando l'interfaccia utente di Visual Studio Code. Vedere Che cosa sono i bundle di asset di Databricks? e le funzionalità di estensione bundle di asset di Databricks.
- Eseguire file di codice Python locali da Visual Studio Code nei cluster Azure Databricks nelle aree di lavoro remote. Si veda Eseguire un file Python in un cluster
- Eseguire file di codice Python locali (
.py
) e Python, R, Scala e notebook SQL (.py
,.ipynb
,.r
,.scala
e.sql
) da Visual Studio Code come processi di Azure Databricks nelle aree di lavoro remote. Si veda Eseguire un file Python come processo. - Impostare e configurare l'ambiente di debug e Databricks Connect usando un semplice elenco di controllo che attiva le finestre di dialogo di selezione. Si veda Eseguire il debug del codice con Databricks Connect per l'estensione Databricks per Visual Studio Code.
- Eseguire il debug delle celle dei notebook per cella in Visual Studio Code con Databricks Connect. Si veda Eseguire ed effettuare il debug delle celle del notebook con Databricks Connect utilizzando l'estensione Databricks per Visual Studio Code.
- Sincronizzare il codice locale sviluppato in Visual Studio Code con il codice nelle aree di lavoro remote.
Nota
L'estensione Databricks per Visual Studio Code supporta l'esecuzione di notebook R, Scala e SQL come processi automatizzati, ma non offre supporto più approfondito per questi linguaggi all'interno di Visual Studio Code.
Operazioni preliminari
Per iniziare a usare l'estensione Databricks per Visual Studio Code:
- Installare l'estensione.
- Creare un nuovo progetto Databricks o eseguire la migrazione di un progetto di Visual Studio Code già esistente.
- Configurare in modo semplice il progetto usando l'interfaccia utente dell'estensione Databricks.
- Eseguire codice Python come parte dell'esercitazione sull'estensione.
- Eseguire il debug del codice usando l'integrazione di Databricks Connect.
- Test del codice utilizzando
pytest
. Si veda Eseguire test con pytest usando l'estensione Databricks per Visual Studio Code.
Creare un nuovo progetto databricks
Dopo aver installato l'estensione, è possibile creare un nuovo progetto Databricks usando l'estensione Databricks per Visual Studio Code:
- Avviare Visual Studio Code.
- Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
- Fare clic su Creare un nuovo progetto Databricks.
- Nel riquadro comandi selezionare un host e un metodo di autenticazione per il progetto. Si veda Configurazione dell'autenticazione per l'estensione Databricks per Visual Studio Code.
- In Specificare un percorso di una cartella in cui si desidera che risieda il nuovo progetto, immettere il percorso della cartella del computer di sviluppo locale in cui si desidera creare il progetto oppure fare clic sulla finestra di dialogo Apri selezione cartella e selezionare il percorso della cartella del progetto.
- Per Modello da usare nella visualizzazione di inizializzazione del progetto Databricks, usare le frecce su e giù per selezionare un modello di progetto e poi premere INVIO. Per informazioni sui modelli di progetto bundle, si veda Modelli di progetto bundle di asset di Databricks.
- Digitare un nome univoco per questo progetto o lasciare il nome predefinito
my_project
, poi premere INVIO. - Scegliere se aggiungere al progetto un notebook stub (esempio), uno stub (esempio) una pipeline di tabelle live Delta o un pacchetto Python stub (esempio) oppure qualsiasi combinazione di questi stub (esempi).
- Premere un tasto qualsiasi per chiudere la scheda dell’editor Init del progetto Databricks.
- Per Selezionare il progetto che si vuole aprire, scegliere il progetto appena creato.
Eseguire la migrazione di un progetto a un progetto Databricks
Se si vuole far migrare un progetto esistente in un progetto Databricks, aprirlo con l'estensione Databricks per Visual Studio Code per iniziare la migrazione:
- Avviare Visual Studio Code. Dal menu principale fare clic su File>Apri cartella e passare al progetto per aprirlo.
- Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
- Fare clic su Esegui migrazione a un progetto Databricks.
- Nel riquadro comandi selezionare un host e un metodo di autenticazione per il progetto. Si veda Configurazione dell'autenticazione per l'estensione Databricks per Visual Studio Code.
Nota
Se si apre un progetto creato usando l'estensione Databricks per Visual Studio Code v1, la migrazione viene tentata automaticamente usando l'autenticazione e la configurazione dell'area di lavoro esistenti del progetto. Il pulsante di migrazione è disponibile solo se la migrazione automatica ha esito negativo.
Aprire un progetto esistente di bundle di asset di Databricks
Se l'estensione Databricks per Visual Studio Code individua più di un progetto di bundle di asset di Databricks nella cartella corrente, l'estensione Databricks per Visual Studio Code consente di scegliere il progetto da aprire.
Nota
Un progetto di bundle di asset di Databricks include un file databricks.yml
nella cartella radice del progetto. Vedere Configurazione del bundle di asset di Databricks.
Avviare Visual Studio Code. Dal menu principale fare clic su File>Apri cartella e passare alla directory che contiene il progetto bundle.
Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
Fare clic su Aprire progetto Databricks esistente.
Nel riquadro comandi selezionare il progetto bundle di asset di Databricks esistente.
Nel riquadro comandi selezionare un host e un metodo di autenticazione per il progetto. Si veda Configurazione dell'autenticazione per l'estensione Databricks per Visual Studio Code.
Aggiungere un altro progetto Databricks all'area di lavoro
L'estensione Databricks per Visual Studio Code consente di disporre di più progetti Databricks all'interno dell'area di lavoro di Visual Studio Code e di passare facilmente dall’uno all’altro. Per aggiungere un altro progetto:
Avviare Visual Studio Code. Dal menu principale fare clic su File>Aggiungi cartella ll’area di lavoro e passare alla directory che contiene gli altri progetti bundle.
Fare clic sull'icona di Databricks nella barra laterale di Visual Studio Code per aprire l'estensione.
Fare clic su Cartella attiva nell’area di lavoro per selezionare il progetto da usare per l'estensione.