Découvrir, connecter et explorer des données dans Synapse en utilisant Microsoft Purview

Dans ce document, vous allez découvrir le type d’interactions que vous pouvez effectuer lors de l’inscription d’un compte Microsoft Purview auprès de Synapse.

Prérequis

Utilisation de Microsoft Purview dans Synapse

Pour utiliser Microsoft Purview dans Synapse, vous devez avoir accès à ce compte Microsoft Purview. Synapse passe votre autorisation Microsoft Purview. Par exemple, si vous avez un rôle d’autorisation conservateur, vous pourrez modifier les métadonnées analysées par Microsoft Purview.

Découverte de données : rechercher dans les jeux de données

Pour découvrir les données enregistrées et analysées par Microsoft Purview, vous pouvez utiliser la barre de recherche en haut au centre de l’espace de travail Synapse. Veillez à sélectionner Microsoft Purview pour rechercher toutes les données de votre organisation.

Recherche des ressources Microsoft Purview

Actions Microsoft Purview

Voici une liste des fonctionnalités Microsoft Purview disponibles dans Synapse :

  • Vue d’ensemble des métadonnées
  • Afficher et modifier le schéma des métadonnées avec les classifications, les termes du glossaire, les types de données et les descriptions
  • Afficher la traçabilité des données pour comprendre les dépendances et effectuer des analyses d’impact. Pour plus d’informations, voir Traçabilité des données.
  • Afficher et modifier Contacts pour savoir qui est propriétaire ou expert d’un jeu de données
  • Connexe pour comprendre les dépendances hiérarchiques d’un jeu de données spécifique. Cette expérience est utile pour parcourir la hiérarchie des données.
  • Cliquez sur Demander l’accès pour demander l’accès aux données en déclenchant le flux de travail d’accès aux données en libre-service configuré par l’administrateur du flux de travail dans Microsoft Purview. Pour plus d’informations, consultez Demander l’accès et Flux de travail d’accès aux données en libre-service.

Actions que vous pouvez effectuer sur les jeux de données avec des ressources Synapse

Connecter des données à Synapse

  • Vous pouvez créer un nouveau service lié à Synapse. Cette action est nécessaire pour copier des données dans Synapse ou les faire figurer dans votre hub de données (pour les sources de données prises en charge telles qu’ADLSg2).
  • Pour les objets tels que les fichiers, les dossiers ou les tables, vous pouvez créer directement un nouveau jeu de données d’intégration et exploiter un service lié existant s’il est déjà créé.

Nous ne sommes pas encore en mesure de déduire l’existence d’un service lié ou d’un jeu de données d’intégration.

 Développer dans Synapse

Vous pouvez effectuer trois actions : Nouveau script SQL, Nouveau notebook et Nouveau flux de données.

Avec Nouveau script SQL, selon le type de prise en charge, vous pouvez :

  • Afficher les 100 premières lignes afin de comprendre la forme des données
  • Créer une table externe à partir d’une base de données Synapse SQL
  • Charger les données dans une base de données Synapse SQL

Avec Nouveau notebook, vous pouvez :

  • Charger des données dans un DataFrame Spark
  • Créer une table Spark (si vous effectuez cette opération au format Parquet, elle crée également une table de pools SQL serverless)

Avec Nouveau flux de données, vous pouvez créer un jeu de données d’intégration qui peut être utilisé comme source dans un pipeline de flux de données. Le flux de données est une capacité de développeur sans code permettant d’effectuer la transformation des données. Pour d’informations sur l’utilisation du flux de données dans Synapse.

 Étapes suivantes