Dokumentinformation – allmän dokumentmodell

Viktigt!

Från och med document intelligence-versionerna 2024-02-29-preview, 2023-10-31-preview och framöver är den allmänna dokumentmodellen (fördefinierade dokumentet) inaktuell. Om du vill extrahera nyckel/värde-par, markeringsmarkeringar, text, tabeller och struktur från dokument använder du följande modeller:

Funktion version Model ID
Layout modell med den valfria frågesträngsparametern features=keyValuePairs aktiverad. • v4:2024-02-29-preview
• v3.1:2023-07-31 (GA)
prebuilt-layout
Allmän dokumentmodell • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-document

Det här innehållet gäller för: Bockmarkering v3.1 (GA) | Senaste version: lila bockmarkering v4.0 (förhandsversion) | Tidigare version: blå bockmarkering v3.0

Det här innehållet gäller för: Bockmarkering v3.0 (GA) | Senaste versioner: lila bockmarkering v4.0 (förhandsversion)lila bockmarkering v3.1

Den allmänna dokumentmodellen kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att extrahera nyckel/värde-par, tabeller och urvalsmarkeringar från dokument. Allmänt dokument är tillgängligt med API:erna v3.1 och v3.0. Mer information finns i vår migreringsguide.

Allmänna dokumentfunktioner

  • Den allmänna dokumentmodellen är en förtränad modell. det kräver inte etiketter eller utbildning.

  • Ett enda API extraherar nyckel/värde-par, markeringsmarkeringar, text, tabeller och struktur från dokument.

  • Den allmänna dokumentmodellen stöder strukturerade, halvstrukturerade och ostrukturerade dokument.

  • Markeringsmarkeringar identifieras som fält med värdet :selected: eller :unselected:.

Exempeldokument som bearbetas i Document Intelligence Studio

Skärmbild av allmän dokumentanalys i Document Intelligence Studio.

Extrahering av nyckel/värde-par

Det allmänna dokument-API:et stöder de flesta formulärtyper och analyserar dina dokument och extraherar nycklar och associerade värden. Det är perfekt för att extrahera vanliga nyckel/värde-par från dokument. Du kan använda den allmänna dokumentmodellen som ett alternativ till att träna en anpassad modell utan etiketter.

Utvecklingsalternativ

Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Allmän dokumentmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-document

Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Allmän dokumentmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-document

Indatakrav

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lästa
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-07-31-preview, 2024-02-29-preview)
  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om 8 punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1 GB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1 den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är 2 den totala storleken på träningsdata GB med högst 10 000 sidor.

Extrahering av allmänna dokumentmodelldata

Prova att extrahera data från formulär och dokument med hjälp av Document Intelligence Studio.

Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure Portal.

Kommentar

Document Intelligence Studio och den allmänna dokumentmodellen är tillgängliga med v3.0-API:et.

  1. På startsidan för Document Intelligence Studio väljer du Allmänna dokument.

  2. Du kan analysera exempeldokumentet eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Nyckel/värde-par

Nyckel/värde-par är specifika intervall i dokumentet som identifierar en etikett eller nyckel och dess associerade svar eller värde. I ett strukturerat formulär kan dessa par vara etiketten och värdet som användaren angav för fältet. I ett ostrukturerat dokument kan det vara det datum då ett kontrakt utfördes baserat på texten i ett stycke. AI-modellen tränas för att extrahera identifierbara nycklar och värden baserat på en mängd olika dokumenttyper, format och strukturer.

Nycklar kan också finnas isolerat när modellen upptäcker att en nyckel finns, utan associerat värde eller när valfria fält bearbetas. Ett mellannamnsfält kan till exempel lämnas tomt i ett formulär i vissa fall. Nyckel/värde-par är textintervall som finns i dokumentet. För dokument där samma värde beskrivs på olika sätt, till exempel kund/användare, är den associerade nyckeln antingen kund eller användare (baserat på kontext).

Extrahering av data

Modell Extrahering av text Nyckel/värde-par Markeringsmarkeringar Tabeller Vanliga namn
Allmänt dokument ✓*

✔* – Endast tillgängligt i 2023-07-31 (v3.1 GA) och senare API-versioner.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – modeller för dokumentanalys för en fullständig lista över språk som stöds.

Att tänka på

  • Eftersom nycklar är textintervall som extraheras från dokumentet måste nycklar mappas till en befintlig ordlista med nycklar för halvstrukturerade dokument.

  • Förvänta dig att se nyckel/värde-par med en nyckel, men inget värde. Till exempel om en användare väljer att inte ange en e-postadress i formuläret.

Nästa steg

  • Följ migreringsguiden för Document Intelligence v3.1 för att lära dig hur du använder v3.1-versionen i dina program och arbetsflöden.

  • Utforska vårt REST API.