Jak používat rozpoznávání pojmenovaných entit (NER)
Funkce NER může vyhodnotit nestrukturovaný text a extrahovat pojmenované entity z textu v několika předdefinovaných kategoriích, například osoby, umístění, událost, produkt a organizace.
Možnosti vývoje
Pokud chcete použít rozpoznávání pojmenovaných entit, odešlete nezpracovaný nestrukturovaný text pro analýzu a zpracujete výstup rozhraní API ve vaší aplikaci. Analýza se provádí tak, jak je, bez dalšího přizpůsobení modelu používaného na vašich datech. Rozpoznávání pojmenovaných entit můžete použít dvěma způsoby:
Možnost vývoje | Popis |
---|---|
Language Studio | Language Studio je webová platforma, která umožňuje vyzkoušet propojení entit s textovými příklady bez účtu Azure a vlastní data při registraci. Další informace najdete na webu language Studio nebo v rychlém startu language studio. |
ROZHRANÍ REST API nebo klientská knihovna (Azure SDK) | Integrujte rozpoznávání pojmenovaných entit do svých aplikací pomocí rozhraní REST API nebo klientské knihovny dostupné v různých jazycích. Další informace najdete v rychlém startu pro rozpoznávání pojmenovaných entit. |
Určení způsobu zpracování dat (volitelné)
Vstupní jazyky
Při odesílání dokumentů, které se mají zpracovat, můžete určit, ve kterých podporovaných jazycích jsou napsané. Pokud nezadáte jazyk, extrahování klíčových frází je výchozí pro angličtinu. Rozhraní API může v reakci na podporu různých kódování vícejazyčných a emoji vracet posuny.
Odesílání dat
Analýza se provede po přijetí žádosti. Synchronní použití funkce NER je bezstavové. Ve vašem účtu se neukládají žádná data a výsledky se vrátí okamžitě v odpovědi.
Při asynchronním použití této funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od doby, kdy se žádost ingestovala, a je uvedena v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.
Rozhraní API se pokusí rozpoznat definované kategorie entit pro daný jazyk dokumentu.
Získání výsledků NER
Když dostanete výsledky z NER, můžete výsledky streamovat do aplikace nebo uložit výstup do souboru v místním systému. Odpověď rozhraní API bude zahrnovat rozpoznané entity, včetně jejich kategorií a podkategorií a skóre spolehlivosti.
Vyberte entity, které se mají vrátit (jenom rozhraní API ve verzi Preview).
Počínaje rozhraním API verze 2023-04-15-preview se rozhraní API pokusí rozpoznat definované typy entit a značky pro daný jazyk dokumentu. Typy entit a značky nahrazují kategorie a podkategorie strukturu starších modelů, které používají k definování entit pro větší flexibilitu. Můžete také určit, které entity jsou zjištěny a vráceny, použít volitelné includeList
a excludeList
parametry s příslušnými typy entit. Následující příklad by zjistil pouze Location
. Můžete zadat jeden nebo více typů entit, které se mají vrátit. Vzhledem k typům a hierarchii značek zavedených pro tuto verzi máte flexibilitu filtrovat podle různých úrovní členitosti:
Vstup:
Poznámka:
V tomto příkladu vrátí pouze typ entity Location .
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Výše uvedené příklady by vrátily entity spadající pod Location
typ entity, jako GPE
je například , Structural
a Geological
označené entity, jak jsou popsány typy entit a značky. Mohli bychom také dále filtrovat vrácené entity filtrováním pomocí jedné ze značek entit pro Location
typ entity, jako je například filtrování podle GPE
značky, jak je popsáno:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Tato metoda vrátí všechny Location
entity, které spadají pod GPE
značku, a ignorují všechny ostatní entity spadající pod Location
typ, který je označen jakoukoli jinou značkou entity, jako Structural
jsou nebo Geological
označené Location
entity. Mohli bychom také přejít k podrobnostem o našich výsledcích pomocí parametru excludeList
. GPE
označené entity mohou být označeny následujícími značkami: City
, State
, CountryRegion
, Continent
. Mohli bychom například vyloučit a CountryRegion
řadit Continent
značky pro náš příklad:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Pomocí těchto parametrů můžeme úspěšně filtrovat pouze Location
typy entit, protože GPE
značka entity zahrnutá v parametru includeList
Location
spadá pod daný typ. Potom vyfiltrujeme pouze geopolitické entity a vyloučíme všechny entity označené značkamiContinent
.CountryRegion
Určení modelu NER
Ve výchozím nastavení tato funkce ve vašem textu používá nejnovější dostupný model AI. Můžete také nakonfigurovat požadavky rozhraní API tak, aby používaly konkrétní verzi modelu.
Limity služeb a dat
Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v článku o omezeních služeb.