Qu’est-ce que l’extension Databricks pour Visual Studio Code ?
L’extension Databricks pour Visual Studio Code vous permet de vous connecter à vos espaces de travail Azure Databricks distants à partir de l’environnement de développement intégré (IDE) Visual Studio Code qui est exécuté sur votre ordinateur de développement local. Vous pouvez ensuite :
- Définir, déployer et exécuter des packs de ressources Databricks pour appliquer des modèles CI/CD et les meilleures pratiques à vos travaux Azure Databricks, pipelines Delta Live Tables et piles MLOps à l’aide de l’interface utilisateur Visual Studio Code. Consultez Que sont les packs de ressources Databricks ? et Fonctionnalités d’extension des packs de ressources Databricks.
- Exécuter des fichiers de code Python local à partir de Visual Studio Code sur des clusters Azure Databricks dans vos espaces de travail distants. Consultez Exécuter un fichier Python sur un cluster
- Exécuter des fichiers de code Python local (
.py
) et des notebooks Python (.py
,.ipynb
,.r
,.scala
, et.sql
) à partir de Visual Studio Code comme des travaux Azure Databricks dans vos espaces de travail distants. Consultez Exécuter un fichier Python en tant que travail. - Installer et configurer votre environnement de débogage et Databricks Connect à l’aide d’une liste de contrôle simple qui déclenche des boîtes de dialogue de sélection. Consultez Déboguer le code à l’aide de Databricks Connect pour l’extension Databricks pour Visual Studio Code.
- Déboguer les notebooks cellule par cellule dans Visual Studio Code avec Databricks Connect. Consultez Exécuter et déboguer des cellules de notebook avec Databricks Connect en utilisant l’extension Databricks pour Visual Studio Code.
- Synchroniser le code local que vous développez dans Visual Studio Code avec le code de vos espaces de travail distants.
Remarque
L’extension Databricks pour Visual Studio Code prend en charge l’exécution de notebooks R, Scala et SQL en tant que travaux automatisés, mais ne fournit pas de prise en charge plus approfondie de ces langages dans Visual Studio Code.
Démarrage
Pour commencer à utiliser l’extension Databricks pour Visual Studio Code :
- Installez l’extension.
- Créez un nouveau projet Databricks ou migrez un projet Visual Studio Code existant.
- Configurez facilement votre projet à l’aide de l’interface utilisateur de l’extension Databricks.
- Exécutez du code Python dans le cadre du didacticiel sur l’extension.
- Déboguez votre code en utilisant l’intégration Databricks Connect.
- Testez votre code en utilisant
pytest
. Consultez Exécuter des tests avec pytest à l’aide de l’extension Databricks pour Visual Studio Code.
Créer un nouveau projet Databricks
Une fois l’extension installée, vous pouvez créer un projet Databricks à l’aide de l’extension Databricks pour Visual Studio Code :
- Lancer Visual Studio Code.
- Cliquez sur l’icône Databricks dans la barre latérale de Visual Studio Code pour ouvrir l’extension.
- Cliquez sur Créer un nouveau projet Databricks.
- Dans la palette de commandes, sélectionnez un hôte et une méthode d’authentification pour le projet. Consultez configuration de l’authentification pour l’extension Databricks pour Visual Studio Code.
- Dans Fournir un chemin d’accès à un dossier dans lequel vous souhaitez que votre nouveau projet soit, entrez le chemin d’accès à un dossier sur votre ordinateur de développement local où vous souhaitez créer le projet, ou cliquez sur Ouvrir la boîte de dialogue de sélection du dossier, puis sélectionnez le chemin d’accès au dossier du projet.
- Pour le modèle à utiliser dans la vue d’initialisation du projet Databricks, utilisez les flèches haut et bas pour sélectionner un modèle de projet, puis appuyez sur Entrée. Pour plus d’informations sur les modèles de projets de packs, consultez Modèles de projets de packs de ressources Databricks.
- Tapez un nom unique pour ce projet pour le projet ou conservez le nom du projet par défaut
my_project
, puis appuyez sur Entrée. - Choisissez d’ajouter un notebook stub (exemple), un pipeline Delta Live Tables (exemple) ou un package Python stub (exemple) au projet, ou une combinaison de ces stubs (exemples).
- Appuyez sur n’importe quelle touche pour fermer l’onglet de l’éditeur Init du projet Databricks.
- Pour sélectionner le projet que vous souhaitez ouvrir, choisissez le projet que vous venez de créer.
Migrer un projet vers un projet Databricks
Si vous avez un projet existant que vous souhaitez migrer vers un projet Databricks, ouvrez-le avec l’extension Databricks pour Visual Studio Code pour commencer la migration :
- Lancer Visual Studio Code. Dans le menu principal, cliquez sur Fichier>Ouvrir le dossier et accédez à votre projet pour l’ouvrir.
- Cliquez sur l’icône Databricks dans la barre latérale de Visual Studio Code pour ouvrir l’extension.
- Cliquez sur Migrer vers un projet Databricks.
- Dans la palette de commandes, sélectionnez un hôte et une méthode d’authentification pour le projet. Consultez Configuration de l’authentification pour l’extension Databricks pour Visual Studio Code.
Remarque
Si vous ouvrez un projet créé à l’aide de l’extension Databricks pour Visual Studio Code v1, la migration est tentée automatiquement à l’aide de la configuration existante de l’authentification et de l’espace de travail du projet. Le bouton de migration est disponible uniquement si la migration automatique échoue.
Ouvrir un projet de packs de ressources Databricks existant
Si l’extension Databricks pour Visual Studio Code découvre plusieurs projets packs de ressources Databricks dans le dossier actif, l’extension Databricks pour Visual Studio Code vous permet de choisir le projet à ouvrir.
Remarque
Un projet de packs de ressources Databricks a un fichier databricks.yml
dans le dossier racine du projet. Consultez Configuration du pack de ressources Databricks.
Lancer Visual Studio Code. Dans le menu principal, cliquez sur Fichier>Ouvrir le dossier et accédez au répertoire qui contient votre projet groupé.
Cliquez sur l’icône Databricks dans la barre latérale de Visual Studio Code pour ouvrir l’extension.
Cliquez sur Ouvrir le projet Databricks existant.
Dans la palette de commandes, sélectionnez votre projet de packs de ressources Databricks existant.
Dans la palette de commandes, sélectionnez un hôte et une méthode d’authentification pour le projet. Consultez configuration de l’authentification pour l’extension Databricks pour Visual Studio Code.
Ajouter un autre projet Databricks à l’espace de travail
L’extension Databricks pour Visual Studio Code vous permet d’avoir plusieurs projets Databricks au sein de votre espace de travail Visual Studio Code et de basculer facilement entre eux. Pour ajouter un autre projet :
Lancer Visual Studio Code. Dans le menu principal, cliquez sur Fichier>Ajouter un dossier à l’espace de travail et accédez au répertoire qui contient votre autre projet groupé.
Cliquez sur l’icône Databricks dans la barre latérale de Visual Studio Code pour ouvrir l’extension.
Cliquez sur Dossier d’espace de travail actif pour sélectionner le projet à utiliser pour l’extension.