Vad är anpassad textklassificering?

Artikel
10/16/2024

Klassificering av anpassad text är en av de anpassade funktioner som erbjuds av Azure AI Language. Det är en molnbaserad API-tjänst som tillämpar maskininlärningsinformation så att du kan skapa anpassade modeller för textklassificeringsuppgifter.

Med anpassad textklassificering kan användare skapa anpassade AI-modeller för att klassificera text i anpassade klasser som fördefinierats av användaren. Genom att skapa ett anpassat textklassificeringsprojekt kan utvecklare iterativt märka data, träna, utvärdera och förbättra modellprestanda innan de gör dem tillgängliga för förbrukning. Kvaliteten på etiketterade data påverkar modellens prestanda avsevärt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio. Du kan enkelt komma igång med tjänsten genom att följa stegen i den här snabbstarten.

Anpassad textklassificering stöder två typer av projekt:

Klassificering med en etikett – du kan tilldela en enskild klass för varje dokument i datauppsättningen. Ett filmskript kan till exempel bara klassificeras som "Romance" eller "Comedy".
Klassificering med flera etiketter – du kan tilldela flera klasser för varje dokument i datauppsättningen. Ett filmmanus kan till exempel klassificeras som "Comedy" eller "Romance" och "Comedy".

Den här dokumentationen innehåller följande artikeltyper:

Snabbstarter är komma igång-instruktioner som hjälper dig att göra begäranden till tjänsten.
Begrepp ger förklaringar av tjänstens funktioner och funktioner.
Instruktionsguider innehåller instruktioner för hur du använder tjänsten på mer specifika eller anpassade sätt.

Exempel på användningsscenarier

Anpassad textklassificering kan användas i flera scenarier i olika branscher:

Automatisk e-post eller biljetttriage

Supportcenter av alla typer får en stor mängd e-postmeddelanden eller biljetter som innehåller ostrukturerad, frihandstext och bifogade filer. Det är viktigt att granska, bekräfta och dirigera ämnesexperter i interna team i tid. E-posttriage i den här skalan kräver att personer granskar och dirigerar till rätt avdelningar, vilket tar tid och resurser. Anpassad textklassificering kan användas för att analysera inkommande text och sortera och kategorisera innehållet som ska dirigeras automatiskt till relevanta avdelningar för ytterligare åtgärder.

Kunskapsutvinning för att förbättra/berika semantisk sökning

Sökningen är grundläggande för alla appar som visar textinnehåll för användarna. Vanliga scenarier är katalog- eller dokumentsökningar, produktsökningar i detaljhandeln eller kunskapsutvinning för datavetenskap. Många företag inom olika branscher försöker skapa en omfattande sökupplevelse över privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av pipelinen kan utvecklare använda anpassad textklassificering för att kategorisera sin text i klasser som är relevanta för deras bransch. De förutsagda klasserna kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

Livscykel för projektutveckling

Att skapa ett anpassat textklassificeringsprojekt omfattar vanligtvis flera olika steg.

Följ dessa steg för att få ut mesta möjliga av din modell:

Definiera schemat: Känna till dina data och identifiera de klasser som du vill skilja mellan för att undvika tvetydighet.
Märka dina data: Kvaliteten på dataetiketter är en viktig faktor för att fastställa modellprestanda. Dokument som tillhör samma klass bör alltid ha samma klass, om du har ett dokument som kan ingå i två klasser använder du klassificeringsprojekt med flera etiketter. Undvik klassambiguity, se till att dina klasser är tydligt avgränsade från varandra, särskilt med klassificeringsprojekt med en etikett.
Träna modellen: Din modell börjar lära sig från dina märkta data.
Visa modellens prestanda: Visa utvärderingsinformationen för din modell för att avgöra hur bra den presterar när den introduceras för nya data.
Distribuera modellen: Om du distribuerar en modell blir den tillgänglig för användning via Analys-API:et.
Klassificera text: Använd din anpassade modell för anpassade textklassificeringsuppgifter.

Referensdokumentation och kodexempel

När du använder anpassad textklassificering kan du läsa följande referensdokumentation och exempel för Azure AI Language:

Utvecklingsalternativ/språk	Referensdokumentation	Exempel
REST-API:er (redigering)	Dokumentation om REST API
REST-API:er (Runtime)	Dokumentation om REST API
C# (Runtime)	C#-dokumentation	C#-exempel – C#-exempel med enkel etikettklassificering – Klassificering med flera etiketter
Java (Runtime)	Java-dokumentation	Java-exempel – Java-exempel med enkel etikettklassificering – Klassificering med flera etiketter
JavaScript (Runtime)	JavaScript-dokumentation	JavaScript-exempel – JavaScript-exempel med enkel etikettklassificering – Klassificering med flera etiketter
Python (Runtime)	Python-dokumentation	Python-exempel – Python-exempel med enkel etikettklassificering – Klassificering med flera etiketter

Ansvarsfull AI

Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Läs transparensanteckningen för anpassad textklassificering för att lära dig mer om ansvarsfull AI-användning och distribution i dina system. Du kan också se följande artiklar för mer information:

Nästa steg

Använd snabbstartsartikeln för att börja använda anpassad textklassificering.
När du går igenom livscykeln för projektutveckling läser du ordlistan för att lära dig mer om de termer som används i dokumentationen för den här funktionen.
Kom ihåg att visa tjänstbegränsningarna för information, till exempel regional tillgänglighet.

Dela via