Kognitiver Skill „Entitätsverknüpfung“ (v3)

Der Skill Entitätsverknüpfung (v3) gibt eine Liste der erkannten Entitäten mit Links zu Artikeln in einer bekannten Wissensdatenbank (Wikipedia) zurück.

Hinweis

Dieser Skill ist an die Entitätsverknüpfung-Modelle für maschinelles Lernen in Azure AI Language gebunden und setzt eine abrechenbare Ressource für Transaktionen voraus, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure AI Services berechnet.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Datengrenzwerte

Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten vor dem Senden an den Skill „Entitätsverknüpfung“ aufteilen müssen, denken Sie daran, den Skill „Textaufteilung“ zu verwenden. Wenn Sie einen Textteilungs-Skill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.

Skillparameter

Bei den Parameternamen, die alle optional sind, muss die Groß-/Kleinschreibung beachtet werden.

Parametername Beschreibung
defaultLanguageCode Sprachcode des Eingabetexts. Wenn kein Standardsprachcode festgelegt ist, wird Englisch (en) als Standardsprachcode verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.
minimumPrecision Ein Wert zwischen 0 und 1 ein. Wenn die Zuverlässigkeitsbewertung (in der entities-Ausgabe) unter diesem Wert liegt, wird die Entität nicht zurückgegeben. Der Standardwert ist 0.
modelVersion (Optional) Gibt die Version des Modells an, die beim Aufruf der Entitätsverknüpfung verwendet wird. Wenn nichts angegeben ist, wird standardmäßig die neueste verfügbare Version verwendet. Es wird empfohlen, diesen Wert nur anzugeben, wenn es notwendig ist.

Skilleingaben

Eingabename Beschreibung
languageCode Eine Zeichenfolge, die die Sprache der Datensätze angibt. Wenn dieser Parameter nicht angegeben ist, wird der Standardsprachcode zur Analyse der Datensätze verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.
text Der zu analysierende Text

Skillausgaben

Ausgabename Beschreibung
entities Ein Array mit komplexen Typen und den folgenden Feldern:
  • "name" (der tatsächliche Entitätsname, wie er im Text angezeigt wird)
  • "id"
  • "language" (die Sprache des Texts, wie vom Skill ermittelt)
  • "url" (die URL zu dieser Entität)
  • bingId“ (die Bing-ID für diese verknüpfte Entität)
  • "dataSource" (die der URL zugeordnete Datenquelle)
  • "matches" (ein Array aus komplexen Typen, das text, offset, length und confidenceScoreenthält)

Beispieldefinition

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Beispieleingabe

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Beispielausgabe

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Die für Entitäten in der Ausgabe dieser Qualifikation zurückgegebenen Offsets werden direkt von den Sprachdienst-APIs zurückgegeben. Dies bedeutet, dass Sie, wenn Sie sie zum Indizieren in der ursprünglichen Zeichenfolge verwenden, die StringInfo-Klasse in .NET verwenden müssen, um den richtigen Inhalt zu extrahieren. Weitere Informationen finden Sie unter Mehrsprachige und Emoji-Unterstützung in Sprachdienstfeatures.

Warnungsfälle

Wird der Sprachcode für das Dokument nicht unterstützt, wird eine Warnung zurückgegeben, und es werden keine Entitäten extrahiert.

Siehe auch