Avant de créer un modèle de classification par catégorie

Avant de créer votre modèle de classification par catégorie, vous devrez vous assurer que vos données sont dans Microsoft Dataverse, et sont structurées au format correct.

Conditions préalables

  • Ce modèle nécessite que les données d’apprentissage soient disponibles dans une table Dataverse. La prise en charge des données provenant de sources externes n’est actuellement pas disponible.

  • Assurez-vous que votre administrateur vous a attribué un rôle de sécurité avec le privilège de lecture pour la table contenant les données de formation.

  • Vérifiez que vous disposez des autorisations permettant de créer des tables dans votre environnement Power Platform. Vous pouvez utiliser les rôles de sécurité intégrés Personnalisateur de système ou Administrateur système.

Langues prises en charge

La classification par catégorie AI Builder prend en charge les langues suivantes : Si vous essayez de classer du texte dans d’autres langues, votre modèle peut ne pas fonctionner correctement.

  • Anglais
  • Français
  • Allemand
  • Italien
  • Espagnol
  • Portugais

Préparation des données

Les données d’entraînement utilisées pour entraîner le modèle à partir de la table Dataverse doit être conforme à ce qui suit :

  • Stockez le texte et les balises sur deux colonnes dans le même tableau. Chaque ligne doit contenir des données dans la colonne Texte.

  • Vous pouvez fournir une ou plusieurs balises aux données de la même ligne dans la colonne Texte. Vous pouvez également laisser la colonne Mots clés vide.

  • Si vous avez identifié plusieurs balises dans l’exemple de texte, fournissez-les sous forme de texte délimité dans les champs Mots clés. Actuellement, les virgules (,), les points-virgules (;) et les caractères de tabulation sont des séparateurs pris en charge.

    Texte Balises
    Superbe chambre propre et calme avec un petit déjeuner gratuit à emporter Salle à manger
    Petite chambre bien agencée qui était confortable Salle
    J’adore la vue du 13ème étage (aucun)
  • Assurez-vous d’avoir un minimum de 10 échantillons de texte distincts pour chaque balise à extraire. Les tags avec moins de 10 échantillons ne seront pas entraînés. Dans l’exemple précédent, il aurait dû y avoir un minimum de 10 lignes chacune qui ont été étiquetées avec les mots clés À manger et Salle.

  • Si Salle a été balisé dans moins de 10 lignes dans les données, il sera ignoré. Le modèle ne sera pas entraîné pour catégoriser les données pour cette balise.

  • Pour chaque balise utilisée, fournissez un minimum de 10 échantillons de texte où n’est pas utilisé.

    Texte Balises
    Superbe chambre propre et calme avec un petit déjeuner gratuit Salle
    Petite chambre bien agencée qui était confortable Salle
    (aucun) Salle

    Si toutes les lignes du tableau sont étiquetées sur Chambre, et qu’aucune ligne (ou moins de 10 lignes) n’a été étiquetée sur une autre étiquette, le modèle échouera au processus d’apprentissage.

  • Une table doit avoir au moins deux balises, et chacune doit avoir 10 échantillons de texte.

  • Vous pouvez définir jusqu’à 200 balises distinctes. Chaque balise est une catégorie qui sera identifiée et extraite du texte donné.

  • Chaque échantillon de données textuelles doit comporter moins de 5 000 caractères.

Si vous ne disposez pas de données de formation et souhaitez tester la classification par catégorie AI Builder, suivez ces instructions afin d’utiliser des exemples de données.

Exemples de format de données d’entraînement

Cette section fournit des exemples de format de données d’entraînement dans une table Dataverse.

Colonnes Type de données Taille
Commentaires Texte 3,000
Balises Texte 100



Commentaires Balises
Pendant mon séjour, j’ai été complètement ignoré. Le personnel n’a pas réussi à me satisfaire mes attentes
Aspirer et avoir une infection urinaire. J’ai aussi eu une pneumonie.
Se soucier
J’ai été vu très rapidement après mon arrivée à chaque fois et tout le personnel, infirmière, médecin,
Et l’anesthésiste ont été très utiles. Il semble y avoir un bon sens du travail d’équipe.
Personnel, Enregistrement
L’équipement semblait à jour. L’infirmière/assistante de santé semblait
assez attentionnée.
Installations, Personnel

Note

Si vous ne disposez pas de vos propres données de formation et que vous souhaitez essayer la classification par catégorie AI Builder, vous pouvez commencer par télécharger des exemples de données pour le modèle de classification par catégorie. Pour plus d’informations : Utiliser des exemples de données pour effectuer une classification par catégorie.

Importer vos données dans Dataverse

Étant donné que les données d’entraînement pour un modèle de classification par catégorie doivent être disponibles sous forme de table Dataverse, commençons par préparer les données dans la table Dataverse.

Dataverse comprend un ensemble puissant de connecteurs afin de vous aider à importer des données à partir de nombreuses sources. Pour plus d’informations : Ajouter des données à une table dans Microsoft Dataverse en utilisant Power Query.

Par exemple, voici comment importer des données de formation d’une feuille Excel. Cet exemple utilise un fichier contenant ce qui est indiqué dans le tableau suivant.

ID Balises Texte
1 Dîner Le petit déjeuner était un peu compliqué.
2 Salle à manger Superbe chambre propre et calme avec un petit déjeuner gratuit.
3 Chambre, salle à manger, emplacement Le personnel avec qui nous avons eu affaire était très sympathique et serviable. Les couloirs et notre chambre étaient propres et confortables. Le petit déjeuner (inclus) était des muffins et des bagels.
4 Emplacement, Dîner Les environs regorgent de bars et de restaurants. 
5 Service Le personnel était respectueux.

Dans l’exemple, les balises sont séparées par une virgule (,). Vous pouvez également utiliser un point-virgule (;) ou un caractère de tabulation.

  1. Connectez-vous à Power Apps.

  2. Sélectionnez l’environnement dans lequel vous souhaitez travailler.

    Capture d’écran de la sélection de votre environnement.

  3. Sélectionner Données>Tables.

  4. Sélectionnez votre table. Si vous n’avez pas encore de table, suivez les étapes dans Créer une table personnalisée.

  5. Sélectionnez Données>Obtenir des données>Obtenir des données à partir d’Excel du ruban de la table sélectionnée.

    Capture d’écran montrant Obtenir des données à partir d’Excel.

  6. Dans l’écran Importer des données, sélectionnez le fichier Excel qui contient les données mentionnées dans la section Exemples de format de données d’entraînement plus tôt dans cette rubrique, puis sélectionnez Télécharger.

    Capture d’écran du téléchargement d’un fichier Excel.

  7. Pour revoir les mappages de champs sur l’écran Mappages de colonnes pour la catégorie de texte, sélectionnez Mapper les colonnes.

    Capture d’écran montrant les mappages de colonnes pour la catégorie de texte.

    Le côté gauche répertorie toutes les colonnes définies dans le tableau. La liste déroulante à droite montre les colonnes disponibles dans le fichier Excel.

    Mappez les colonnes Mots clés, Texte et Identifiant d’Excel aux colonnes respectives du tableau.

  8. Après avoir mappé les colonnes, revenez à l’étape d’importation en sélectionnant Enregistrer les modifications dans le coin supérieur droit.

    Capture d’écran de l’enregistrement de vos modifications.

  9. Après avoir vu le Statut de mappage comme réussi, commencez le processus d’importation en sélectionnant Importer dans le coin supérieur droit.

    Capture d’écran du démarrage du processus d’importation en sélectionnant le bouton Importer.

  10. Le processus d’importation peut prendre quelques minutes selon le volume de données importées. Après quelques minutes, rafraîchissez l’onglet Données du tableau pour retrouver tous les enregistrements importés du fichier Excel.

Vous êtes maintenant prêt à passer à l’étape suivante.

Étape suivante

Créer un modèle de classification par catégorie