Se connecter et gérer Cassandra dans Microsoft Purview

Cet article explique comment inscrire Cassandra et comment s’authentifier et interagir avec Cassandra dans Microsoft Purview. Pour plus d’informations sur Microsoft Purview, consultez l’article d’introduction.

Fonctionnalités prises en charge

Extraction de métadonnées Analyse complète Analyse incrémentielle Analyse délimitée Classification Étiquetage Stratégie d’accès Traçabilité Partage de données Affichage en direct
Oui Oui Non Oui Non Non Non Oui Non Non

Les versions de serveur Cassandra prises en charge sont 3. x ou 4. x.

Lors de l’analyse de la source Cassandra, Microsoft Purview prend en charge :

  • Extraction de métadonnées techniques, notamment :

    • Cluster
    • Espaces de clés
    • Tables, y compris les colonnes et les index
    • Vues matérialisées, y compris les colonnes
  • Extraction de la traçabilité statique sur les relations des ressources entre les tables et les vues matérialisées.

Lors de la configuration de l’analyse, vous pouvez choisir d’analyser un instance Cassandra entier ou d’étendre l’analyse à un sous-ensemble d’espaces de clés correspondant au(s) nom(s) ou modèle(s) de nom donné(s).

Limitations connues

Lorsque l’objet est supprimé de la source de données, l’analyse suivante ne supprime pas automatiquement la ressource correspondante dans Microsoft Purview.

Configuration requise

Remarque

Si votre magasin de données n’est pas accessible publiquement (si votre magasin de données limite l’accès à partir d’un réseau local, d’un réseau privé ou d’adresses IP spécifiques, etc.), vous devez configurer un runtime d’intégration auto-hébergé pour vous y connecter.

Inscrire

Cette section explique comment inscrire Cassandra dans Microsoft Purview à l’aide du portail de gouvernance Microsoft Purview.

Étapes d’inscription

Pour inscrire un nouveau serveur Cassandra dans votre catalogue de données :

  1. Ouvrez le portail de gouvernance Microsoft Purview en :

  2. Sélectionnez Data Map dans le volet gauche.

  3. Sélectionner Inscription.

  4. Dans l’écran Inscrire les sources , sélectionnez Cassandra, puis Sélectionnez Continuer :

    Capture d’écran montrant l’écran Inscrire des sources.

  5. Dans l’écran Inscrire des sources (Cassandra) :

    1. Entrez un Nom. La source de données utilise ce nom dans le catalogue.
    2. Dans la zone Hôte , entrez l’adresse du serveur sur lequel le serveur Cassandra s’exécute. Par exemple, 20.190.193.10.
    3. Dans la zone Port , entrez le port utilisé par le serveur Cassandra.
    4. Sélectionnez une collection dans la liste. Capture d’écran montrant l’écran Inscrire des sources (Cassandra).
    5. Sélectionner Inscription.

Analyser

Suivez les étapes ci-dessous pour analyser Cassandra afin d’identifier automatiquement les ressources. Pour plus d’informations sur l’analyse en général, consultez notre présentation des analyses et de l’ingestion

Créer et exécuter une analyse

Pour créer et exécuter une nouvelle analyse :

  1. Si votre serveur est accessible publiquement, passez à l’étape 2. Sinon, vous devez vous assurer que votre runtime d’intégration auto-hébergé est configuré :

    1. Dans le portail de gouvernance Microsoft Purview, accédez au Centre de gestion, puis sélectionnez Runtimes d’intégration.
    2. Assurez-vous qu’un runtime d’intégration auto-hébergé est disponible. Si vous n’en configurez pas un, suivez les étapes mentionnées dans Conditions préalables pour configurer un runtime d’intégration auto-hébergé.
  2. Dans le portail de gouvernance Microsoft Purview, accédez à Sources.

  3. Sélectionnez le serveur Cassandra inscrit.

  4. Sélectionnez Nouvelle analyse.

  5. Fournissez les détails suivants.

    1. Nom : spécifiez un nom pour l’analyse.

    2. Se connecter via le runtime d’intégration : sélectionnez le runtime d’intégration à résolution automatique Azure si votre serveur est accessible publiquement, ou votre runtime d’intégration auto-hébergé configuré s’il n’est pas disponible publiquement.

    3. Informations d’identification : lorsque vous configurez les informations d’identification Cassandra, veillez à :

      • Sélectionnez Authentification de base comme méthode d’authentification.
      • Dans la zone Nom d’utilisateur , indiquez le nom de l’utilisateur pour lequel vous créez la connexion.
      • Dans le secret du coffre de clés, enregistrez le mot de passe de l’utilisateur Cassandra pour lequel vous créez la connexion.

      Pour plus d’informations, consultez Informations d’identification pour l’authentification source dans Microsoft Purview.

    4. Espaces de clés : spécifiez une liste d’espaces de clés Cassandra à importer. Plusieurs espaces de clés doivent être séparés par des points-virgules. Par exemple : keyspace1;keyspace2. Lorsque la liste est vide, tous les espaces de clés disponibles sont importés.

    5. Utiliser SSL (Secure Sockets Layer) : sélectionnez True ou False pour spécifier s’il faut utiliser SSL (Secure Sockets Layer) lors de la connexion au serveur Cassandra. Par défaut, cette option est définie sur False.

    6. Mémoire maximale disponible (applicable lors de l’utilisation du runtime d’intégration auto-hébergé) : spécifiez la mémoire maximale (en Go) disponible sur votre machine virtuelle à utiliser pour les processus d’analyse. Cette valeur dépend de la taille du serveur Cassandra à analyser. analyser la source Cassandra

  6. Sélectionnez Tester la connexion pour valider les paramètres.

  7. Cliquez sur Continuer.

  8. Sélectionnez un déclencheur d’analyse. Vous pouvez configurer une planification ou exécuter l’analyse une seule fois.

  9. Passez en revue votre analyse, puis sélectionnez Enregistrer et exécuter.

Afficher vos analyses et exécutions d’analyse

Pour afficher les analyses existantes :

  1. Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.
  2. Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .
  3. Sélectionnez l’analyse qui contient les résultats que vous souhaitez afficher. Le volet affiche toutes les exécutions d’analyse précédentes, ainsi que les status et les métriques pour chaque exécution d’analyse.
  4. Sélectionnez l’ID d’exécution pour case activée les détails de l’exécution de l’analyse.

Gérer vos analyses

Pour modifier, annuler ou supprimer une analyse :

  1. Accédez au portail Microsoft Purview. Dans le volet gauche, sélectionnez Mappage de données.

  2. Sélectionnez la source de données. Vous pouvez afficher une liste des analyses existantes sur cette source de données sous Analyses récentes, ou vous pouvez afficher toutes les analyses sous l’onglet Analyses .

  3. Sélectionnez l’analyse que vous souhaitez gérer. Vous pouvez ensuite :

    • Modifiez l’analyse en sélectionnant Modifier l’analyse.
    • Annulez une analyse en cours en sélectionnant Annuler l’exécution de l’analyse.
    • Supprimez votre analyse en sélectionnant Supprimer l’analyse.

Remarque

  • La suppression de votre analyse ne supprime pas les ressources de catalogue créées à partir d’analyses précédentes.

Traçabilité

Après avoir analysé votre source Cassandra, vous pouvez parcourir le catalogue de données ou rechercher dans le catalogue de données pour afficher les détails de la ressource.

Accédez à l’onglet Ressource -> Traçabilité, vous pouvez voir la relation de ressource le cas échéant. Reportez-vous à la section fonctionnalités prises en charge sur les scénarios de traçabilité Cassandra pris en charge. Pour plus d’informations sur la traçabilité en général, consultez le guide de l’utilisateur sur la traçabilité et la traçabilité des données.

Vue de traçabilité Cassandra

Étapes suivantes

Maintenant que vous avez inscrit votre source, suivez les guides ci-dessous pour en savoir plus sur Microsoft Purview et vos données.