Compétence cognitive Reconnaissance d’entités nommées (v2)

La compétence Reconnaissance d’entités nommées (v2) extrait les entités nommées du texte. Sont notamment disponibles les types d’entités suivants : person, location et organization.

Important

La compétence de reconnaissance des entités nommées (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) est désormais abandonnée et remplacée par Microsoft.Skills.Text.V3.EntityRecognitionSk. Suivez les recommandations de la page Compétences Azure AI Search déconseillées pour migrer vers une compétence prise en charge.

Remarque

Si vous élargissez le champ en augmentant la fréquence des traitements, en ajoutant des documents supplémentaires ou en ajoutant plusieurs algorithmes d’IA, vous devez attacher une ressource de service Azure AI facturable. Des frais sont applicables durant l’appel des API dans les services Azure AI ainsi que pour l’extraction d’images durant la phase d’extraction du contenu des documents d’Azure AI Search. L’extraction de texte à partir des documents est gratuite. L'exécution des compétences intégrées est facturée au prix actuel du paiement à l'utilisation des services Azure AI.

L’extraction d’images est un supplément facturé par Azure AI Search, comme décrit sur la page de tarification. L’extraction de texte est gratuite.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Limites de données

La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length. Si vous devez subdiviser vos données avant de les envoyer à l’extracteur de phrases clés, envisagez d’utiliser la compétence Fractionnement de texte. Si vous utilisez une compétence de fractionnement de texte, définissez la longueur de la page sur 5 000 pour obtenir les meilleures performances.

Paramètres de la compétence

Les paramètres respectent la casse.

Nom du paramètre Description
categories Tableau des catégories à extraire. Types de catégories possibles : "Person", "Location", "Organization". Si aucune catégorie n’est précisée, tous les types sont retournés.
defaultLanguageCode Code de langue du texte d’entrée. Langues prises en charge : de, en, es, fr, it.
minimumPrecision Nombre compris entre 0 et 1. Si la précision est inférieure à cette valeur, l’entité n’est pas retournée. La valeur par défaut est 0.

Entrées de la compétence

Nom de l'entrée Description
languageCode facultatif. La valeur par défaut est "en".
texte Texte à analyser.

Sorties de la compétence

Nom de sortie Description
persons Tableau de chaînes représentant chacune le nom d’une personne.
locations Tableau de chaînes représentant chacune un lieu.
Organisations Tableau de chaînes représentant chacune une organisation.
entities Tableau de types complexes. Chaque type complexe contient les champs suivants :
  • la catégorie ("person", "organization" ou "location") ;
  • la valeur (le nom réel de l’entité) ;
  • le décalage (l’emplacement où elle a été trouvée dans le texte) ;
  • la confiance (une valeur comprise entre 0 et 1 représentant la confiance accordée à la valeur en tant qu’entité réelle).

Exemple de définition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Exemple d’entrée

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Exemple de sortie

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Cas d’avertissement

Si le code de langue du document n’est pas pris en charge, un avertissement est retourné et aucune entité n’est extraite.

Voir aussi