Se connecter et gérer Cassandra dans Microsoft Purview
Cet article explique comment inscrire Cassandra et comment s’authentifier et interagir avec Cassandra dans Microsoft Purview. Pour plus d’informations sur Microsoft Purview, consultez l’article d’introduction.
Fonctionnalités prises en charge
Extraction de métadonnées | Analyse complète | Analyse incrémentielle | Analyse délimitée | Classification | Étiquetage | Stratégie d’accès | Traçabilité | Partage de données | Affichage en direct |
---|---|---|---|---|---|---|---|---|---|
Oui | Oui | Non | Oui | Non | Non | Non | Oui | Non | Non |
Les versions de serveur Cassandra prises en charge sont 3. x ou 4. x.
Lors de l’analyse de la source Cassandra, Microsoft Purview prend en charge :
Extraction de métadonnées techniques, notamment :
- Cluster
- Espaces de clés
- Tables, y compris les colonnes et les index
- Vues matérialisées, y compris les colonnes
Extraction de la traçabilité statique sur les relations des ressources entre les tables et les vues matérialisées.
Lors de la configuration de l’analyse, vous pouvez choisir d’analyser un instance Cassandra entier ou d’étendre l’analyse à un sous-ensemble d’espaces de clés correspondant au(s) nom(s) ou modèle(s) de nom donné(s).
Limitations connues
Lorsque l’objet est supprimé de la source de données, l’analyse suivante ne supprime pas automatiquement la ressource correspondante dans Microsoft Purview.
Configuration requise
- Un compte Azure avec un abonnement actif. Créez un compte gratuitement.
- Un compte Microsoft Purview actif.
- Vous avez besoin des autorisations Administrateur de source de données et Lecteur de données pour inscrire une source et la gérer dans le portail de gouvernance Microsoft Purview. Pour plus d’informations sur les autorisations, consultez Contrôle d’accès dans Microsoft Purview.
Remarque
Si votre magasin de données n’est pas accessible publiquement (si votre magasin de données limite l’accès à partir d’un réseau local, d’un réseau privé ou d’adresses IP spécifiques, etc.), vous devez configurer un runtime d’intégration auto-hébergé pour vous y connecter.
- Si votre source de données n’est pas accessible publiquement, configurez le dernier runtime d’intégration auto-hébergé.
-
Choisissez le runtime d’intégration approprié pour votre scénario :
-
Pour utiliser un runtime d’intégration auto-hébergé :
- Suivez l’article pour créer et configurer un runtime d’intégration auto-hébergé.
- Vérifiez que JDK 11 est installé sur l’ordinateur sur lequel le runtime d’intégration auto-hébergé est installé. Redémarrez la machine après avoir installé le JDK pour qu’il prenne effet.
- Vérifiez que Visual C++ Redistributable (version Visual Studio 2012 Update 4 ou ultérieure) est installé sur l’ordinateur sur lequel le runtime d’intégration auto-hébergé est en cours d’exécution. Si cette mise à jour n’est pas installée, téléchargez-la maintenant.
- Pour utiliser un runtime d’intégration auto-hébergé pris en charge par Kubernetes :
-
Pour utiliser un runtime d’intégration auto-hébergé :
-
Choisissez le runtime d’intégration approprié pour votre scénario :
Inscrire
Cette section explique comment inscrire Cassandra dans Microsoft Purview à l’aide du portail de gouvernance Microsoft Purview.
Étapes d’inscription
Pour inscrire un nouveau serveur Cassandra dans votre catalogue de données :
Ouvrez le portail de gouvernance Microsoft Purview en :
- Accédez directement à https://web.purview.azure.com votre compte Microsoft Purview et sélectionnez-les.
- Ouverture du Portail Azure, recherchez et sélectionnez le compte Microsoft Purview. Sélectionnez le bouton Portail de gouvernance Microsoft Purview .
Sélectionnez Data Map dans le volet gauche.
Sélectionner Inscription.
Dans l’écran Inscrire les sources , sélectionnez Cassandra, puis Sélectionnez Continuer :
Dans l’écran Inscrire des sources (Cassandra) :
- Entrez un Nom. La source de données utilise ce nom dans le catalogue.
- Dans la zone Hôte , entrez l’adresse du serveur sur lequel le serveur Cassandra s’exécute. Par exemple, 20.190.193.10.
- Dans la zone Port , entrez le port utilisé par le serveur Cassandra.
- Sélectionnez une collection dans la liste.
- Sélectionner Inscription.
Analyser
Suivez les étapes ci-dessous pour analyser Cassandra afin d’identifier automatiquement les ressources. Pour plus d’informations sur l’analyse en général, consultez notre présentation des analyses et de l’ingestion
Créer et exécuter une analyse
Pour créer et exécuter une nouvelle analyse :
Si votre serveur est accessible publiquement, passez à l’étape 2. Sinon, vous devez vous assurer que votre runtime d’intégration auto-hébergé est configuré :
- Dans le portail de gouvernance Microsoft Purview, accédez au Centre de gestion, puis sélectionnez Runtimes d’intégration.
- Assurez-vous qu’un runtime d’intégration auto-hébergé est disponible. Si vous n’en configurez pas un, suivez les étapes mentionnées dans Conditions préalables pour configurer un runtime d’intégration auto-hébergé.
Dans le portail de gouvernance Microsoft Purview, accédez à Sources.
Sélectionnez le serveur Cassandra inscrit.
Sélectionnez Nouvelle analyse.
Fournissez les détails suivants.
Nom : spécifiez un nom pour l’analyse.
Se connecter via le runtime d’intégration : sélectionnez le runtime d’intégration à résolution automatique Azure si votre serveur est accessible publiquement, ou votre runtime d’intégration auto-hébergé configuré s’il n’est pas disponible publiquement.
Informations d’identification : lorsque vous configurez les informations d’identification Cassandra, veillez à :
- Sélectionnez Authentification de base comme méthode d’authentification.
- Dans la zone Nom d’utilisateur , indiquez le nom de l’utilisateur pour lequel vous créez la connexion.
- Dans le secret du coffre de clés, enregistrez le mot de passe de l’utilisateur Cassandra pour lequel vous créez la connexion.
Pour plus d’informations, consultez Informations d’identification pour l’authentification source dans Microsoft Purview.
Espaces de clés : spécifiez une liste d’espaces de clés Cassandra à importer. Plusieurs espaces de clés doivent être séparés par des points-virgules. Par exemple :
keyspace1;keyspace2
. Lorsque la liste est vide, tous les espaces de clés disponibles sont importés.Utiliser SSL (Secure Sockets Layer) : sélectionnez True ou False pour spécifier s’il faut utiliser SSL (Secure Sockets Layer) lors de la connexion au serveur Cassandra. Par défaut, cette option est définie sur False.
Mémoire maximale disponible (applicable lors de l’utilisation du runtime d’intégration auto-hébergé) : spécifiez la mémoire maximale (en Go) disponible sur votre machine virtuelle à utiliser pour les processus d’analyse. Cette valeur dépend de la taille du serveur Cassandra à analyser.
Sélectionnez Tester la connexion pour valider les paramètres.
Cliquez sur Continuer.
Sélectionnez un déclencheur d’analyse. Vous pouvez configurer une planification ou exécuter l’analyse une seule fois.
Passez en revue votre analyse, puis sélectionnez Enregistrer et exécuter.
Afficher vos analyses et exécutions d’analyse
Pour afficher les analyses existantes :
- Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.
- Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .
- Sélectionnez l’analyse qui contient les résultats que vous souhaitez afficher. Le volet affiche toutes les exécutions d’analyse précédentes, ainsi que les status et les métriques pour chaque exécution d’analyse.
- Sélectionnez l’ID d’exécution pour case activée les détails de l’exécution de l’analyse.
Gérer vos analyses
Pour modifier, annuler ou supprimer une analyse :
Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.
Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .
Sélectionnez l’analyse que vous souhaitez gérer. Vous pouvez ensuite :
- Modifiez l’analyse en sélectionnant Modifier l’analyse.
- Annulez une analyse en cours en sélectionnant Annuler l’exécution de l’analyse.
- Supprimez votre analyse en sélectionnant Supprimer l’analyse.
Remarque
- La suppression de votre analyse ne supprime pas les ressources de catalogue créées à partir d’analyses précédentes.
Traçabilité
Après avoir analysé votre source Cassandra, vous pouvez parcourir le catalogue de données ou rechercher dans le catalogue de données pour afficher les détails de la ressource.
Accédez à l’onglet Ressource -> Traçabilité, vous pouvez voir la relation de ressource le cas échéant. Reportez-vous à la section fonctionnalités prises en charge sur les scénarios de traçabilité Cassandra pris en charge. Pour plus d’informations sur la traçabilité en général, consultez le guide de l’utilisateur sur la traçabilité et la traçabilité des données.
Étapes suivantes
Maintenant que vous avez inscrit votre source, suivez les guides ci-dessous pour en savoir plus sur Microsoft Purview et vos données.