Visualisations dans les notebooks Databricks

Azure Databricks offre une prise en charge intégrée des graphiques et des visualisations dans Databricks SQL et dans les notebooks. Cette page explique comment utiliser des visualisations dans un notebook Databricks. Pour plus d’informations sur l’utilisation des visualisations dans Databricks SQL, consultez Visualisation dans Databricks SQL.

Pour afficher les types de visualisations, consultez Types de visualisation.

Important

Pour plus d’informations sur une préversion des graphiques Azure Databricks, veuillez consulter Visualisations de graphiques en préversion.

Créer une visualisation

Pour recréer l’exemple de cette section, utilisez le code suivant :

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Pour créer une visualisation, cliquez sur + au-dessus d’un résultat et sélectionnez Visualisation. L’éditeur de visualisation s’affiche.

Menu de nouvelle visualisation

  1. Dans la liste déroulante Type de visualisation, choisissez un type.

    Éditeur de visualisation

  2. Sélectionnez les données à afficher dans la visualisation. Les champs disponibles dépendent du type sélectionné.

  3. Cliquez sur Enregistrer.

Outils de visualisation

Si vous survolez la partie supérieure droite d’un graphique dans l’éditeur de visualisation, une barre d’outils Plotly s’affiche et vous permet d’effectuer des opérations telles que la sélection, le zoom et le panoramique.

Barre d’outils d’éditeur de visualisation de notebook

Si vous pointez en haut à droite d’un graphique en dehors de l’éditeur de visualisation, un sous-ensemble d’outils plus petit s’affiche :

Barre d’outils du graphique de notebook

Créer un profil de données

Remarque

Disponible dans Databricks Runtime 9.1 LTS et ultérieur.

Les profils de données affichent une synthèse des statistiques d’un DataFrame Apache Spark, d’un DataFrame pandas ou d’une table SQL au format tabulaire et graphique. Pour créer un profil de données à partir d’une cellule de résultats, cliquez sur + et sélectionnez Profil de données.

Azure Databricks calcule et affiche la synthèse des statistiques.

Profil de données

  • Les fonctionnalités numériques et de catégorie sont indiquées dans des tables distinctes.
  • En haut de l’onglet, vous pouvez trier ou rechercher des fonctionnalités.
  • En haut de la colonne de graphique, vous pouvez choisir d’afficher un histogramme (standard) ou des quantiles.
  • Cochez développer pour agrandir les graphiques.
  • Cochez log pour afficher les graphiques sur une échelle logarithmique.
  • Vous pouvez pointer votre curseur sur les graphiques pour obtenir des informations plus détaillées, telles que les limites d’une colonne d’histogramme et le nombre de lignes qu’elle contient, ou la valeur de quantile.

Vous pouvez également générer des profils de données par programmation. Consultez la commande summarize (dbutils.data.summarize).

Utiliser des visualisations et des profils de données

Remarque

Les profils de données sont disponibles dans Databricks Runtime 9.1 LTS et versions ultérieures.

Renommer, dupliquer ou supprimer une visualisation ou un profil de données

Pour renommer, dupliquer ou supprimer une visualisation ou un profil de données, cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.

Menu déroulant de visualisation de notebook

Vous pouvez également modifier le nom en cliquant directement dessus et en modifiant le nom en place.

Modifier une visualisation

Cliquez sur bouton Modifier la visualisation sous la visualisation pour ouvrir l’éditeur de visualisation. Lorsque vous avez terminé vos modifications, cliquez sur Enregistrer.

Modifier les couleurs

Vous pouvez personnaliser les couleurs d’une visualisation quand vous créez la visualisation ou en la modifiant.

  1. Créez ou modifiez une visualisation.
  2. Cliquez sur Couleurs.
  3. Pour modifier une couleur, cliquez sur le carré et sélectionnez la nouvelle couleur en procédant de l’une des façons suivantes :
    • Cliquez dessus dans le sélecteur de couleurs.
    • Entrez une valeur hexadécimale.
  4. Cliquez n’importe où en dehors du sélecteur de couleur pour le fermer et enregistrer les modifications.

Masquer ou afficher temporairement une série

Pour masquer une série dans une visualisation, cliquez sur la série dans la légende. Pour afficher à nouveau la série, recliquez dans la légende.

Pour afficher une seule série, double-cliquez sur la série dans la légende. Pour afficher d’autres séries, cliquez sur chacune d’elles.

Télécharger une visualisation

Pour télécharger une visualisation au format .png, cliquez sur l’icône d’appareil-photo icône d’appareil-photodans la cellule du notebook ou dans l’éditeur de visualisation.

  • Dans une cellule de résultat, l’icône d’appareil photo apparaît en haut à droite lorsque vous déplacez le curseur sur la cellule.

    appareil-photo dans la cellule du notebook

  • Dans l’éditeur de visualisation, l’icône d’appareil-photo s’affiche lorsque vous déplacez le curseur sur le graphique. Consultez Outils de visualisation.

Ajouter une visualisation ou un profil de données à un tableau de bord

  1. Cliquez sur la flèche pointant vers le bas à droite du nom de l’onglet.
  2. Sélectionnez Ajouter au tableau de bord. Une liste des affichages de tableau de bord disponibles s’affiche, ainsi qu’une option de menu Ajouter au nouveau tableau de bord.
  3. Sélectionnez un tableau de bord ou sélectionnez Ajouter au nouveau tableau de bord. Le tableau de bord s’affiche, avec la visualisation ou le profil de données nouvellement ajouté.