Dokumentintelligens bankutdragsmodell

Dokumentinformationsmodellen för bankutdrag kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera data från amerikanska bankutdrag. API:et analyserar tryckta bankutdrag. extraherar viktig information, till exempel kontonummer, bankuppgifter, kontoutdragsinformation, transaktionsinformation och avgifter. och returnerar en strukturerad JSON-datarepresentation.

Funktion version Model ID
Bankutdragsmodell • v4.0:2024-07-31 (förhandsversion) prebuilt-bankStatement.us

Extrahering av bankutdragsdata

Ett bankkontoutdrag hjälper dig att granska kontots aktiviteter under en angiven period. Det är ett officiellt uttalande som hjälper till att identifiera bedrägerier, spåra utgifter, redovisningsfel och registrera periodens aktiviteter. Se hur data extraheras med hjälp av prebuilt-bankStatement.us modellen. Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt

  • En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

    Skärmbild av nycklar och slutpunktsplats i Azure Portal.

Document Intelligence Studio

  1. På startsidan för Document Intelligence Studio väljer du bankutdrag.

  2. Du kan analysera exempelbankutdraget eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Indatakrav

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lästa
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-07-31-preview, 2024-02-29-preview)
  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om 8 punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1 GB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1 den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är 2 den totala storleken på träningsdata GB med högst 10 000 sidor.

Språk och nationella inställningar som stöds

En fullständig lista över språk som stöds finns på vår fördefinierade supportsida för modellspråk.

Fältextraheringar

Information om vilka dokumentextraheringsfält som stöds finns på sidan för schema för bankkontrollmodell i vår GitHub-exempellagringsplats.

Språk som stöds

Den prebuilt-bankStatement.us version 2027-07-31-preview stöder nationella inställningar för en-us .

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.