Synchroniser votre source de données Excel avec Dataverse à l’aide d’un flux de données

L’un des scénarios courants qui se produisent lorsque vous intégrez des données dans Dataverse est le maintien de la synchronisation de celles-ci avec la source. Vous pouvez vous servir du flux de données standard pour charger des données dans Dataverse. Cet article explique comment maintenir les données synchronisées avec le système source.

Importance de la colonne clé

Si vous utilisez comme source un système de base de données relationnelle, normalement, vous disposez de colonnes clés dans les tables, et la mise en forme des données convient pour un chargement dans Dataverse. Toutefois, les données des fichiers Excel ne sont pas toujours très ordonnées. Vous disposez souvent d’un fichier Excel avec des feuilles de données sans colonne clé. Dans Considérations relatives au mappage de champs pour des flux de données standard, vous pouvez voir que, s’il existe une colonne clé dans la source, elle peut être facilement utilisée comme clé secondaire dans le mappage de champs du flux de données.

Configuration d’une clé secondaire.

La présence d’une colonne clé est importante pour la table dans Dataverse. La colonne clé est l’identificateur de ligne. Elle contient des valeurs uniques dans chaque ligne. L’utilisation d’une colonne clé permet d’éviter les lignes en double, et permet de synchroniser les données avec le système source. Si une ligne est supprimée du système source, une colonne clé permet de la trouver, ainsi que de la supprimer de Dataverse.

Création d’une colonne clé

Si vous n’avez pas de colonne clé dans votre source de données (Excel, fichier texte ou toute autre source), vous pouvez en générer une à l’aide de la méthode suivante :

  1. Nettoyez vos données.

    La première étape pour créer la colonne clé consiste à supprimer toutes les lignes vides ou inutiles, à nettoyer les données, et à supprimer les doublons éventuels.

    Données propres.

  2. Ajoutez une colonne d’index.

    Une fois les données nettoyées, l’étape suivante consiste à leur attribuer une colonne clé. À cet effet, vous pouvez utiliser la commande Ajouter une colonne d’index sous l’onglet Ajouter une colonne.

    Ajouter une colonne d’index.

Lorsque vous ajoutez la colonne d’index, vous disposez de quelques options pour la personnaliser, par exemple, en modifiant le numéro de départ ou le nombre de valeurs à sauter à chaque fois. La valeur de départ par défaut est zéro, et elle augmente d’une valeur à chaque fois.

Utiliser la colonne clé comme clé secondaire

Maintenant que vous avez la ou les colonnes clés, vous pouvez affecter le mappage de champs du flux de données à la clé secondaire.

Définition des champs de Clé secondaire.

Le paramétrage est simple ; vous devez juste définir la clé secondaire. Toutefois, si vous avez plusieurs fichiers ou tables, il a une autre étape à prendre en compte.

Si vous avez plusieurs fichiers

Si vous n’avez qu’un seul fichier (ou feuille ou tableau) Excel, les étapes de la procédure précédente suffisent pour définir la clé secondaire. En revanche, si vous avez plusieurs fichiers (ou feuilles ou tables) présentant la même structure (mais avec des données différentes), vous devez les ajouter ensemble.

Si vous obtenez des données de plusieurs fichiers Excel, l’option Combiner des fichiers de Power Query ajoutera automatiquement toutes les données ensemble, et le résultat ressemblera à l’image suivante.

Image montrant plusieurs fichiers ajoutés ensemble.

Comme illustré dans l’image précédente, outre le résultat de l’ajout, Power Query introduit également la colonne Source.Name, qui contient le nom du fichier. Si la valeur d’index dans chaque fichier pourrait être unique, elle ne l’est pas dans plusieurs fichiers. En revanche, la combinaison de la colonne Index et de la colonne Source.Name est une combinaison unique. Choisissez une clé secondaire composite pour ce scénario.

Clé composite.

Supprimer les lignes qui n’existent plus dans la sortie de requête

La dernière étape consiste à sélectionner l’option Supprimer les lignes qui n’existent plus dans la sortie de requête. Cette option compare les données de la table Dataverse à celles de la source sur la base de la clé secondaire (qui pourrait être une clé composite), et supprime les lignes qui n’existent plus. Par conséquent, vos données dans Dataverse seront toujours synchronisées avec votre source de données.

Supprimer les lignes qui n’existent plus.