Der kognitive Skill „Erkennung benannter Entitäten“ (v2)

Artikel
09/01/2024

Der Skill Erkennung benannter Entitäten (v2) extrahiert benannte Entitäten aus Text. Zu den verfügbaren Entitäten gehören die Typen person, location und organization.

Wichtig

Der Skill Erkennung benannter Entitäten (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) wurde jetzt eingestellt und ersetzt durch Microsoft.Skills.Text.V3.EntityRecognitionSkill. Führen Sie unter Berücksichtigung der Empfehlungen unter Veraltete Azure AI Search Skills eine Migration zu einem unterstützten Skill durch.

Hinweis

Wenn Sie den Umfang erweitern, indem Sie die Verarbeitungsfrequenz erhöhen oder weitere Dokumente oder KI-Algorithmen hinzufügen, müssen Sie eine kostenpflichtige Azure KI Services-Ressource anfügen. Gebühren fallen beim Aufrufen von APIs in Azure AI Services sowie für die Bildextraktion im Rahmen der Dokumentaufschlüsselungsphase in Azure AI Search an. Für die Textextraktion aus Dokumenten fallen keine Gebühren an. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure AI Services berechnet.

Die Bildextraktion ist eine zusätzliche Gebühr, die durch Azure AI Search berechnet wird, wie auf der Seite mit der Preisübersicht beschrieben. Die Textextraktion ist kostenlos.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Datengrenzwerte

Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden. Wenn Sie einen Textteilungsskill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.

Skillparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Parametername	Beschreibung
categories	Array von zu extrahierenden Kategorien. Mögliche Kategorietypen: `"Person"`, `"Location"`, `"Organization"`. Wenn keine Kategorie angegeben ist, werden alle Typen zurückgegeben.
defaultLanguageCode	Sprachcode des Eingabetexts. Die folgenden Sprachen werden unterstützt: `de, en, es, fr, it`
minimumPrecision	Eine Zahl zwischen 0 und 1. Wenn die Genauigkeit unter diesem Wert liegt, wird die Entität nicht zurückgegeben. Der Standardwert ist 0.

Skilleingaben

Eingabename	Beschreibung
languageCode	Optional. Der Standardwert ist `"en"`.
text	Der zu analysierende Text

Skillausgaben

Ausgabename	Beschreibung
persons	Ein Array von Zeichenfolgen, wobei jede Zeichenfolge den Namen einer Person darstellt.
locations	Ein Array von Zeichenfolgen, wobei jede Zeichenfolge einen Ort darstellt.
Organisationen	Ein Array von Zeichenfolgen, wobei jede Zeichenfolge eine Organisation darstellt.
entities	Ein Array komplexer Typen. Jeder komplexe Typ umfasst die folgenden Felder: category (`"person"`, `"organization"` oder `"location"`) value (der tatsächliche Entitätsname) offset (die Fundstelle im Text) confidence (Ein Wert zwischen 0 und 1, der das Vertrauen darstellt, dass der Wert eine tatsächliche Entität ist.)

Beispieldefinition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Beispieleingabe

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Beispielausgabe

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warnungsfälle

Wird der Sprachcode für das Dokument nicht unterstützt, wird eine Warnung zurückgegeben, und es werden keine Entitäten extrahiert.

Freigeben über