Vad är anpassad namngiven entitetsigenkänning?
Anpassad NER är en av de anpassade funktioner som erbjuds av Azure AI Language. Det är en molnbaserad API-tjänst som tillämpar maskininlärningsinformation så att du kan skapa anpassade modeller för anpassade namngivna entitetsigenkänningsuppgifter.
Anpassad NER gör det möjligt för användare att skapa anpassade AI-modeller för att extrahera domänspecifika entiteter från ostrukturerad text, till exempel kontrakt eller finansiella dokument. Genom att skapa ett anpassat NER-projekt kan utvecklare iterativt märka data, träna, utvärdera och förbättra modellprestanda innan de gör dem tillgängliga för förbrukning. Kvaliteten på etiketterade data påverkar modellens prestanda avsevärt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.
Den här dokumentationen innehåller följande artikeltyper:
- Snabbstarter är komma igång-instruktioner som hjälper dig att göra begäranden till tjänsten.
- Begrepp ger förklaringar av tjänstens funktioner och funktioner.
- Instruktionsguider innehåller instruktioner för hur du använder tjänsten på mer specifika eller anpassade sätt.
Exempel på användningsscenarier
Anpassad namngiven entitetsigenkänning kan användas i flera scenarier i olika branscher:
Informationsextrahering
Många finansiella och juridiska organisationer extraherar och normaliserar data från tusentals komplexa, ostrukturerade textkällor dagligen. Sådana källor omfattar bankutdrag, juridiska avtal eller bankformulär. Till exempel kan det ta flera dagar att extrahera dataextrahering av inteckningsprogram som görs manuellt av mänskliga granskare. Om du automatiserar de här stegen genom att skapa en anpassad NER-modell förenklas processen och kostnader, tid och arbete sparas.
Kunskapsutvinning för att förbättra/berika semantisk sökning
Sökningen är grundläggande för alla appar som visar textinnehåll för användarna. Vanliga scenarier är katalog- eller dokumentsökning, produktsökning i detaljhandeln eller kunskapsutvinning för datavetenskap. Många företag i olika branscher vill skapa en omfattande sökupplevelse över privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av pipelinen kan utvecklare använda anpassad NER för att extrahera entiteter från texten som är relevanta för deras bransch. Dessa entiteter kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.
Granskning och efterlevnad
I stället för att manuellt granska betydligt långa textfiler för granskning och tillämpning av principer kan IT-avdelningar i finansiella eller juridiska företag använda anpassad NER för att skapa automatiserade lösningar. De här lösningarna kan vara användbara för att tillämpa efterlevnadsprinciper och konfigurera nödvändiga affärsregler baserat på kunskapsutvinningspipelines som bearbetar strukturerat och ostrukturerat innehåll.
Livscykel för projektutveckling
Att använda anpassad NER omfattar vanligtvis flera olika steg.
Definiera ditt schema: Känna till dina data och identifiera de entiteter som du vill extrahera. Undvik tvetydighet.
Märka dina data: Märkning av data är en viktig faktor för att fastställa modellprestanda. Märk exakt, konsekvent och fullständigt.
- Etikett exakt: Etikettera varje entitet till rätt typ alltid. Inkludera bara det du vill extrahera, undvik onödiga data i etiketterna.
- Etikett konsekvent: Samma entitet bör ha samma etikett i alla filer.
- Etikett helt: Märk alla instanser av entiteten i alla dina filer.
Träna modellen: Din modell börjar lära sig från dina märkta data.
Visa modellens prestanda: När träningen har slutförts visar du modellens utvärderingsinformation, dess prestanda och vägledning om hur du kan förbättra den.
Distribuera modellen: Om du distribuerar en modell blir den tillgänglig för användning via Analys-API:et.
Extrahera entiteter: Använd dina anpassade modeller för entitetsextraheringsuppgifter.
Referensdokumentation och kodexempel
När du använder anpassad NER kan du läsa följande referensdokumentation och exempel för Azure AI Language:
Utvecklingsalternativ/språk | Referensdokumentation | Exempel |
---|---|---|
REST-API:er (redigering) | Dokumentation om REST API | |
REST-API:er (Runtime) | Dokumentation om REST API | |
C# (Runtime) | C#-dokumentation | C#-exempel |
Java (Runtime) | Java-dokumentation | Java-exempel |
JavaScript (Runtime) | JavaScript-dokumentation | JavaScript-exempel |
Python (Runtime) | Python-dokumentation | Python-exempel |
Ansvarsfull AI
Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Läs transparensanteckningen för anpassad NER för att lära dig mer om ansvarsfull AI-användning och distribution i dina system. Du kan också se följande artiklar för mer information:
- Transparensanteckning för Azure AI Language
- Integrering och ansvarsfull användning
- Data, sekretess och säkerhet
Nästa steg
Använd snabbstartsartikeln för att börja använda anpassad namngiven entitetsigenkänning.
När du går igenom livscykeln för projektutveckling läser du ordlistan för att lära dig mer om de termer som används i dokumentationen för den här funktionen.
Kom ihåg att visa tjänstbegränsningarna för information, till exempel regional tillgänglighet.