Se connecter à PostgreSQL et le gérer dans Microsoft Purview
Cet article explique comment inscrire PostgreSQL et comment s’authentifier et interagir avec PostgreSQL dans Microsoft Purview. Pour plus d’informations sur Microsoft Purview, consultez l’article d’introduction.
Fonctionnalités prises en charge
Extraction de métadonnées | Analyse complète | Analyse incrémentielle | Analyse délimitée | Classification | Étiquetage | Stratégie d’accès | Traçabilité | Partage de données | Affichage en direct |
---|---|---|---|---|---|---|---|---|---|
Oui | Oui | Non | Oui | Non | Non | Non | Oui | Non | Non |
Les versions de serveur PostgreSQL prises en charge sont 8.x à 16.x.
Lors de l’analyse de la source PostgreSQL, Microsoft Purview prend en charge :
Extraction de métadonnées techniques, notamment :
- Serveur
- Bases de données
- Schémas
- Tables incluant les colonnes
- Affichages, y compris les colonnes
Extraction de la traçabilité statique sur les relations de ressources entre les tables et les vues.
Lors de la configuration de l’analyse, vous pouvez choisir d’analyser une base de données PostgreSQL entière ou d’étendre l’analyse à un sous-ensemble de schémas correspondant aux noms ou modèles de nom donnés.
Limitations connues
Lorsque l’objet est supprimé de la source de données, l’analyse suivante ne supprime pas automatiquement la ressource correspondante dans Microsoft Purview.
Configuration requise
- Un compte Azure avec un abonnement actif. Créez un compte gratuitement.
- Un compte Microsoft Purview actif.
- Vous avez besoin des autorisations Administrateur de source de données et Lecteur de données pour inscrire une source et la gérer dans le portail de gouvernance Microsoft Purview. Pour plus d’informations sur les autorisations, consultez Contrôle d’accès dans Microsoft Purview.
Remarque
Si votre magasin de données n’est pas accessible publiquement (si votre magasin de données limite l’accès à partir d’un réseau local, d’un réseau privé ou d’adresses IP spécifiques, etc.), vous devez configurer un runtime d’intégration auto-hébergé pour vous y connecter.
- Si votre source de données n’est pas accessible publiquement, configurez le dernier runtime d’intégration auto-hébergé.
-
Choisissez le runtime d’intégration approprié pour votre scénario :
-
Pour utiliser un runtime d’intégration auto-hébergé :
- Suivez l’article pour créer et configurer un runtime d’intégration auto-hébergé.
- Vérifiez que JDK 11 est installé sur l’ordinateur sur lequel le runtime d’intégration auto-hébergé est installé. Redémarrez la machine après avoir installé le JDK pour qu’il prenne effet.
- Vérifiez que Visual C++ Redistributable (version Visual Studio 2012 Update 4 ou ultérieure) est installé sur l’ordinateur sur lequel le runtime d’intégration auto-hébergé est en cours d’exécution. Si cette mise à jour n’est pas installée, téléchargez-la maintenant.
- Pour utiliser un runtime d’intégration auto-hébergé pris en charge par Kubernetes :
-
Pour utiliser un runtime d’intégration auto-hébergé :
-
Choisissez le runtime d’intégration approprié pour votre scénario :
Autorisations requises pour l’analyse
L’utilisateur PostgreSQL doit disposer d’un accès en lecture aux tables système pour accéder aux métadonnées avancées.
Inscrire
Cette section explique comment inscrire PostgreSQL dans Microsoft Purview à l’aide du portail de gouvernance Microsoft Purview.
Étapes d’inscription
Pour inscrire une nouvelle source PostgreSQL dans votre catalogue de données, procédez comme suit :
- Accédez à votre compte Microsoft Purview dans le portail de gouvernance Microsoft Purview.
- Sélectionnez Data Map dans le volet de navigation de gauche.
- Sélectionnez Inscrire.
- Dans Inscrire des sources, sélectionnez PostgreSQL. Cliquez sur Continuer.
Dans l’écran Inscrire des sources (PostgreSQL), procédez comme suit :
Entrez un Nom indiquant que la source de données sera répertoriée dans le catalogue.
Entrez le nom du serveur pour vous connecter à une source PostgreSQL. Il peut s’agir des deux points suivants :
- Nom d’hôte utilisé pour se connecter au serveur de base de données. Par exemple :
MyDatabaseServer.com
- Une adresse IP. Par exemple :
192.169.1.2
- Nom d’hôte utilisé pour se connecter au serveur de base de données. Par exemple :
Entrez le port utilisé pour se connecter au serveur de base de données (5432 par défaut pour PostgreSQL).
Sélectionnez une collection dans la liste.
Terminez l’inscription de la source de données.
Analyser
Suivez les étapes ci-dessous pour analyser PostgreSQL afin d’identifier automatiquement les ressources. Pour plus d’informations sur l’analyse en général, consultez notre présentation des analyses et de l’ingestion.
Authentification pour une analyse
Le type d’authentification pris en charge pour une source PostgreSQL est l’authentification de base.
Créer et exécuter une analyse
Pour créer et exécuter une nouvelle analyse, procédez comme suit :
Si votre serveur est accessible publiquement, passez à l’étape 2. Sinon, vous devez vous assurer que votre runtime d’intégration auto-hébergé est configuré :
- Dans le portail de gouvernance Microsoft Purview, accédez au Centre de gestion, puis sélectionnez Runtimes d’intégration.
- Assurez-vous qu’un runtime d’intégration auto-hébergé est disponible. Si vous n’en configurez pas un, suivez les étapes mentionnées dans Conditions préalables pour configurer un runtime d’intégration auto-hébergé.
Dans le portail de gouvernance Microsoft Purview, accédez à Sources.
Sélectionnez la source PostgreSQL inscrite.
Sélectionnez + Nouvelle analyse.
Fournissez les détails ci-dessous :
Nom : nom de l’analyse
Se connecter via le runtime d’intégration : sélectionnez le runtime d’intégration à résolution automatique Azure si votre serveur est accessible publiquement, ou votre runtime d’intégration auto-hébergé configuré s’il n’est pas disponible publiquement.
Informations d’identification : sélectionnez les informations d’identification pour vous connecter à votre source de données. Veillez à :
- Sélectionnez Authentification de base lors de la création d’informations d’identification.
- Indiquez le nom d’utilisateur utilisé pour se connecter au serveur de base de données dans le champ d’entrée Nom d’utilisateur.
- Stockez le mot de passe utilisateur utilisé pour se connecter au serveur de base de données dans la clé secrète.
Base de données : spécifiez le nom de la base de données instance à importer.
Schéma : Liste des sous-ensembles de schémas à importer, exprimés sous la forme d’une liste séparée par des points-virgules. Par exemple :
schema1;schema2
. Tous les schémas utilisateur sont importés si cette liste est vide. Tous les schémas système (par exemple, SysAdmin) et les objets sont ignorés par défaut.Les modèles de nom de schéma acceptables peuvent être des noms statiques ou contenir des caractères génériques . Par exemple :
A%;%B;%C%;D
- Commencer par A ou
- Terminer par B ou
- Contenir C ou
- Égal à D
L’utilisation de NOT et de caractères spéciaux n’est pas acceptable.
Mémoire maximale disponible (applicable lors de l’utilisation du runtime d’intégration auto-hébergé) : mémoire maximale (en Go) disponible sur la machine virtuelle du client à utiliser par les processus d’analyse. Cela dépend de la taille de la source PostgreSQL à analyser.
Remarque
En règle générale, fournissez 1 Go de mémoire pour 1 000 tables
Sélectionnez Tester la connexion pour valider les paramètres (disponibles lors de l’utilisation d’Azure Integration Runtime).
Cliquez sur Continuer.
Choisissez votre déclencheur d’analyse. Vous pouvez configurer une planification ou exécuter l’analyse une seule fois.
Passez en revue votre analyse et sélectionnez Enregistrer et exécuter.
Afficher vos analyses et exécutions d’analyse
Pour afficher les analyses existantes :
- Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.
- Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .
- Sélectionnez l’analyse qui contient les résultats que vous souhaitez afficher. Le volet affiche toutes les exécutions d’analyse précédentes, ainsi que les status et les métriques pour chaque exécution d’analyse.
- Sélectionnez l’ID d’exécution pour case activée les détails de l’exécution de l’analyse.
Gérer vos analyses
Pour modifier, annuler ou supprimer une analyse :
Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.
Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .
Sélectionnez l’analyse que vous souhaitez gérer. Vous pouvez ensuite :
- Modifiez l’analyse en sélectionnant Modifier l’analyse.
- Annulez une analyse en cours en sélectionnant Annuler l’exécution de l’analyse.
- Supprimez votre analyse en sélectionnant Supprimer l’analyse.
Remarque
- La suppression de votre analyse ne supprime pas les ressources de catalogue créées à partir d’analyses précédentes.
Traçabilité
Après avoir analysé votre source PostgreSQL, vous pouvez parcourir le catalogue de données ou rechercher dans le catalogue de données pour afficher les détails de la ressource.
Accédez à l’onglet Ressource -> Traçabilité, vous pouvez voir la relation de ressource le cas échéant. Reportez-vous à la section Fonctionnalités prises en charge pour les scénarios de traçabilité PostgreSQL pris en charge. Pour plus d’informations sur la traçabilité en général, consultez le guide de l’utilisateur sur la traçabilité et la traçabilité des données.
Étapes suivantes
Maintenant que vous avez inscrit votre source, suivez les guides ci-dessous pour en savoir plus sur Microsoft Purview et vos données.