Fakturamodell för dokumentinformation
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling. Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-07-31-preview.
- Den offentliga förhandsversionen 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Observera att modellen för anpassad generativ (extrahering av dokumentfält) i AI Studio endast är tillgänglig i regionen USA, norra centrala:
- USA, östra
- USA, västra 2
- Europa, västra
- USA, norra centrala
Det här innehållet gäller för: v4.0 (förhandsversion) | Tidigare versioner: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Det här innehållet gäller för: v3.1 (GA) | Senaste version: v4.0 (förhandsversion) | Tidigare versioner: v3.0 v2.1
Det här innehållet gäller för: v3.0 (GA) | Senaste versioner: v4.0 (förhandsversion) v3.1 | Tidigare version: v2.1
Det här innehållet gäller för: v2.1 | Senaste version: v4.0 (förhandsversion)
Fakturamodellen för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från försäljningsfakturor, verktygsräkningar och inköpsorder. Fakturor kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar fakturatext; extraherar viktig information som kundnamn, faktureringsadress, förfallodatum och förfallodatum. och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande fakturor på 27 språk.
Dokumenttyper som stöds:
- Fakturor
- Fakturor för verktyg
- Försäljningsorder
- Inköpsorder
Automatiserad fakturabearbetning
Automatiserad fakturabearbetning är processen för att extrahera nyckelfält accounts payable
från faktureringskontodokument. Extraherade data innehåller radobjekt från fakturor som är integrerade med dina arbetsflöden för leverantörsreskontra (AP) för granskningar och betalningar. Tidigare utförs leverantörsreskontraprocessen manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från fakturor är vanligtvis det första och ett av de mest kritiska stegen i processen för fakturaautomatisering.
Exempelfaktura som bearbetas med Document Intelligence Studio:
Exempelfaktura som bearbetas med exempeletikettverktyget för dokumentinformation:
Utvecklingsalternativ
Document Intelligence v4.0 (2024-07-31-preview) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Fakturamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad faktura |
Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Fakturamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad faktura |
Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Fakturamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad faktura |
Document Intelligence v2.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser |
---|---|
Fakturamodell | • Etikettverktyg för dokumentinformation• REST API • Klientbiblioteks-SDK • Docker-container för dokumentinformation |
Indatakrav
Filformat som stöds:
Modell PDF Bild: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och
4
MB för den kostnadsfria nivån (F0).Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om
8
punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och
1
GB för den neurala modellen.För anpassad klassificeringsmodellträning är
1
den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är2
den totala storleken på träningsdata GB med högst 10 000 sidor.
- Filformat som stöds: JPEG, PNG, PDF och TIFF.
- PDF och TIFF som stöds, upp till 2 000 sidor bearbetas. För prenumeranter på den kostnadsfria nivån bearbetas endast de två första sidorna.
- Filstorleken som stöds måste vara mindre än 50 MB och dimensionerna minst 50 x 50 bildpunkter och högst 10 000 x 10 000 bildpunkter.
Extrahering av fakturamodelldata
Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från fakturor. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
På startsidan för Document Intelligence Studio väljer du Fakturor.
Du kan analysera exempelfakturan eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :
Exempeletikettverktyg för dokumentinformation
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .
Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.
Välj en URL för filen som du vill analysera från alternativen nedan:
I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .
I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.
I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.
Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.
Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.
Språk och nationella inställningar som stöds
En fullständig lista över språk som stöds finns på vår fördefinierade supportsida för modellspråk.
Fältextrahering
Information om vilka dokumentextraheringsfält som stöds finns på sidan med schema för fakturamodell i vår GitHub-exempellagringsplats.
De nyckel/värde-fakturapar och radobjekt som extraheras finns i
documentResults
avsnittet i JSON-utdata.
Nyckel/värde-par
Den fördefinierade fakturan 2022-06-30 och senare versioner stöder valfri retur av nyckel/värde-par. Som standard inaktiveras returen av nyckel/värde-par. Nyckel/värde-par är specifika intervall i fakturan som identifierar en etikett eller nyckel och dess associerade svar eller värde. På en faktura kan dessa par vara etiketten och värdet som användaren angav för fältet eller telefonnumret. AI-modellen tränas för att extrahera identifierbara nycklar och värden baserat på en mängd olika dokumenttyper, format och strukturer.
Nycklar kan också finnas isolerat när modellen upptäcker att en nyckel finns, utan associerat värde eller när valfria fält bearbetas. Ett mellannamnsfält kan till exempel lämnas tomt i ett formulär i vissa fall. Nyckel/värde-par är alltid textintervall som finns i dokumentet. För dokument där samma värde beskrivs på olika sätt, till exempel kund/användare, är den associerade nyckeln antingen kund eller användare (baserat på kontext).
Fält extraherade
Fakturatjänsten extraherar fälten text, tabeller och 26 faktura. Följande är fälten som extraheras från en faktura i JSON-utdatasvaret (följande utdata använder den här exempelfakturan).
Namn | Type | Beskrivning | Text | Värde (standardiserade utdata) |
---|---|---|---|---|
CustomerName | sträng | Kunden faktureras | Microsoft Corp | |
CustomerId | sträng | Referens-ID för kunden | CID-12345 | |
PurchaseOrder | sträng | Ett inköpsorderreferensnummer | PO-3333 | |
InvoiceId | sträng | ID för den här specifika fakturan (ofta "Fakturanummer") | INV-100 | |
InvoiceDate | datum | Datum då fakturan utfärdades | 11/15/2019 | 2019-11-15 |
DueDate | datum | Datum då betalningen för den här fakturan förfaller | 2019-12-15 | 2019-12-15 |
VendorName | sträng | Leverantör som skapade fakturan | CONTOSO | |
VendorAddress | sträng | E-postadress för leverantören | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | sträng | Namn som är associerat med VendorAddress | Contosos huvudkontor | |
CustomerAddress | sträng | E-postadress för kunden | 123 Annan gata, Redmond, Washington, 98052 | |
CustomerAddressRecipient | sträng | Namn som är associerat med CustomerAddress | Microsoft Corp | |
FaktureringAdress | sträng | Explicit faktureringsadress för kunden | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | sträng | Namn som är associerat med BillingAddress | Microsoft Services | |
ShippingAddress | sträng | Explicit leveransadress för kunden | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | sträng | Namn som är associerat med ShippingAddress | Microsoft Delivery | |
Delsumma | Nummer | Delsummafält som identifierats på den här fakturan | 100,00 $ | 100 |
TotalTax | Nummer | Totalt skattefält som identifierats på den här fakturan | 10,00 $ | 10 |
InvoiceTotal | Nummer | Totalt antal nya avgifter som är associerade med den här fakturan | 110,00 USD | 110 |
AmountDue | Nummer | Totalt belopp som beror på leverantören | 610,00 USD | 610 |
ServiceAddress | sträng | Explicit tjänstadress eller egenskapsadress för kunden | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | sträng | Namn som är associerat med ServiceAddress | Microsoft Services | |
RemittanceAddress | sträng | Explicit remittering eller betalningsadress för kunden | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | sträng | Namn som är associerat med RemittanceAddress | Contoso-fakturering | |
ServiceStartDate | datum | Första datumet för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | datum | Slutdatum för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | Nummer | Explicit tidigare obetalt saldo | 500,00 USD | 500 |
Följande är de radobjekt som extraheras från en faktura i JSON-utdatasvaret och använder den här exempelfakturan:
Namn | Type | Beskrivning | Text (radobjekt nr 1) | Värde (standardiserade utdata) |
---|---|---|---|---|
Artiklar | sträng | Radobjektets textrad med full sträng | 3/4/2021 A123 Consulting Services 2 timmar $30,00 10% $60,00 | |
Belopp | Nummer | Radobjektets mängd | 60,00 USD | 100 |
beskrivning | sträng | Textbeskrivningen för fakturaradsobjektet | Konsulttjänst | Konsulttjänst |
Kvantitet | Nummer | Kvantiteten för det här fakturaradsobjektet | 2 | 2 |
UnitPrice | Nummer | Netto- eller bruttopriset (beroende på fakturans bruttoinställning) för en enhet i det här objektet | 30,00 $ | 30 |
ProductCode | sträng | Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet | A123 | |
Enhet | sträng | Radobjektets enhet, t.ex. kg, lb osv. | timmar | |
Datum | datum | Datum som motsvarar varje radobjekt. Ofta är det ett datum då radartikeln levererades | 3/4/2021 | 2021-03-04 |
Moms | Nummer | Skatt som är associerad med varje radobjekt. Möjliga värden är skattebelopp, skatt %och skatt Y/N | 10 % |
Följande är komplexa fält som extraheras från en faktura i JSON-utdatasvaret:
TaxDetails
Skatteinformation definierar specifika skatter som tillämpas på fakturasumman.
Namn | Type | Beskrivning | Text (radobjekt nr 1) | Värde (standardiserade utdata) |
---|---|---|---|---|
Artiklar | sträng | Fullsträngstextrad i skatteobjektet | V.A.T. 15% $60.00 | |
Belopp | Nummer | Skattebeloppet för skatteposten | 60.00 | 60 |
Taxa | sträng | Skattesatsen för skatteposten | 15 % |
PaymentDetails
Visa en lista över alla identifierade betalningsalternativ som har identifierats i fältet.
Namn | Type | Beskrivning | Text (radobjekt nr 1) | Värde (standardiserade utdata) |
---|---|---|---|---|
IBAN |
sträng | Internt bankkontonummer | GB33BUKB20201555555555 | |
SWIFT |
sträng | SWIFT-kod | BUKBGB22 | |
BankAccountNumber | sträng | Bankkontonummer, en unik identifierare för ett bankkonto | 123456 | |
BPayBillerCode | sträng | Australian B-Pay Biller Code | 12345 | |
BPayReference | sträng | Referenskod för australiensisk B-betalning | 98765432100 |
JSON-utdata
JSON-utdata har tre delar:
"readResults"
noden innehåller alla identifierade text- och markeringsmarkeringar. Text ordnas via sida, sedan efter rad och sedan efter enskilda ord."pageResults"
noden innehåller tabeller och celler som extraherats med sina avgränsningsrutor, konfidens och en referens till raderna och orden i readResults."documentResults"
noden innehåller de fakturaspecifika värden och radobjekt som modellen identifierade. Det är här du hittar alla fält från fakturan, till exempel faktura-ID, leverans till, faktura till, kund, summa, radobjekt och mycket mer.
Migreringsguide
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.
Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.