Kognitivní dovednost Propojování entit (v3)
Dovednost Entity Linking (v3) vrátí seznam rozpoznaných entit s odkazy na články v dobře známém znalostní báze (Wikipedie).
Poznámka:
Tato dovednost je vázána na modely strojového učení Entity Linking v Azure AI Language a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.
@odata.type
Microsoft.Skills.Text.V3.EntityLinkingSkill
Omezení dat
Maximální velikost záznamu by měla být 50 000 znaků měřená String.Length
hodnotou . Pokud potřebujete data před odesláním do dovednosti EntityLinking rozdělit, zvažte použití dovednosti Rozdělení textu. Pokud používáte dovednost rozdělení textu, nastavte délku stránky na 5 000 pro nejlepší výkon.
Parametry dovedností
V názvech parametrů se rozlišují malá a velká písmena a všechny jsou volitelné.
Název parametru | Popis |
---|---|
defaultLanguageCode |
Kód jazyka vstupního textu Pokud není zadaný výchozí kód jazyka, použije se angličtina (en) jako výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků. |
minimumPrecision |
Hodnota mezi 0 a 1. Pokud je skóre spolehlivosti (ve výstupu entities ) nižší než tato hodnota, entita se nevrátí. Výchozí hodnota je 0. |
modelVersion |
(Volitelné) Určuje verzi modelu, která se má použít při volání propojení entit. Pokud není zadaný, nastaví se výchozí hodnota na nejnovější dostupnou. Tuto hodnotu doporučujeme nezadávat, pokud není nutná. |
Vstupy dovedností
Název vstupu | Popis |
---|---|
languageCode |
Řetězec označující jazyk záznamů. Pokud tento parametr není zadaný, použije se k analýze záznamů výchozí kód jazyka. Projděte si kompletní seznam podporovaných jazyků. |
text |
Text, který chcete analyzovat. |
Výstupy dovedností
Název výstupu | Popis |
---|---|
entities |
Pole komplexních typů, které obsahuje následující pole:
|
Ukázková definice
{
"@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
"context": "/document",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "entities",
"targetName": "entities"
}
]
}
Ukázkový vstup
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft is liked by many.",
"languageCode": "en"
}
}
]
}
Ukázkový výstup
{
"values": [
{
"recordId": "1",
"data" :
{
"entities": [
{
"name": "Microsoft",
"id": "Microsoft",
"language": "en",
"url": "https://en.wikipedia.org/wiki/Microsoft",
"bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85",
"dataSource": "Wikipedia",
"matches": [
{
"text": "Microsoft",
"offset": 0,
"length": 9,
"confidenceScore": 0.13
}
]
}
],
}
}
]
}
Posuny vrácené entitami ve výstupu této dovednosti se vrátí přímo z rozhraní API služby jazyka, což znamená, že pokud je používáte k indexování do původního řetězce, měli byste k extrahování správného obsahu použít třídu StringInfo v .NET. Další informace najdete v tématu Podpora vícejazyčných a emoji ve funkcích služby Jazyk.
Případy upozornění
Pokud kód jazyka dokumentu není podporován, vrátí se upozornění a nebudou extrahovány žádné entity.