Nyheter i Azure AI Document Intelligence
Det här innehållet gäller för: v4.0 (förhandsversion) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Dokumentinformationstjänsten uppdateras kontinuerligt. Bokmärke den här sidan för att hålla dig uppdaterad med viktig information, funktionsförbättringar och vår senaste dokumentation.
Viktigt!
Förhandsversioner av API dras tillbaka när GA-API:et har släppts. API-versionen 2023-02-28-preview dras tillbaka, om du fortfarande använder förhandsversions-API:et eller tillhörande SDK-versioner uppdaterar du koden för att rikta in dig på den senaste API-versionen 2023-07-31 (GA).
Augusti 2024
Rest-API:et för dokumentinformation 2024-07-31-preview är nu tillgängligt. Det här förhandsversions-API:et introducerar nya och uppdaterade funktioner:
Förhandsversion 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Den nya modellen för extrahering av dokumentfält i AI Studio är endast tillgänglig i regionen USA, norra centrala:
USA, östra
USA, västra 2
Europa, västra
USA, norra centrala
🆕 Extrahering av dokumentfält (anpassad generativ) modell
- Använd Generativ AI för att extrahera fält från dokument och formulär. Dokumentinformation erbjuder nu en ny modell för extrahering av dokumentfält som använder stora språkmodeller (LLM) för att extrahera fält från ostrukturerade dokument eller strukturerade formulär med en mängd olika visuella mallar. Med grundvärden och konfidenspoäng passar den nya Generative AI-baserade extraheringen in i dina befintliga processer.
🆕 Modell som består av anpassade klassificerare
- Dokumentinformation lägger nu till stöd för att skapa en modell med en explicit anpassad klassificeringsmodell. Läs mer om fördelarna med att använda den nya skrivfunktionen.
Anpassad klassificeringsmodell
- Anpassad klassificeringsmodell stöder nu även uppdatering av modellen på plats.
- Anpassad klassificeringsmodell lägger till stöd för modellkopieringsåtgärd för att aktivera säkerhetskopiering och haveriberedskap.
- Anpassad klassificeringsmodell stöder nu uttryckligen att ange sidor som ska klassificeras från ett indatadokument.
🆕 Modell för inteckningsdokument
- Extrahera information från utvärdering (formulär 1004).
- Extrahera information från validering av anställning (formulär 1005).
-
- Extrahera betalningsmottagare, belopp, datum och annan relevant information från kontroller.
-
- Ny fördefinierade för att bearbeta lönestubbar för att utvinna löner, timmar, avdrag, nettolön med mera.
-
- Ny fördefinierad för att extrahera kontoinformation inklusive början och slutsaldon, transaktionsinformation från bankkontoutdrag.
-
- Ny enhetlig amerikansk skattemodell som kan extraheras från formulär som W-2, 1098, 1099 och 1040.
🆕 Sökbar PDF. Den fördefinierade läsmodellen stöder nu PDF-utdata för att ladda ned PDF-filer med inbäddad text från extraheringsresultat, vilket gör att PDF kan användas i scenarier som sökkopia av innehåll.
Layoutmodellen har nu stöd för förbättrad bildidentifiering där siffror från dokument nu kan laddas ned som en bildfil som ska användas för ytterligare bildtolkning. Layoutmodellen har också förbättringar av OCR-modellen för genomsökt text som förbättrar enkeltecken, textruta och kompakta textdokument.
-
- Dokumentinformation lägger nu till stöd för batchanalys för att analysera en uppsättning dokument för att förenkla utvecklarupplevelsen och förbättra effektiviteten.
-
- Ai-kvaliteten på extrahering av frågefält förbättras med den senaste modellen.
Maj 2024
Document Intelligence Studio lägger till stöd för Microsoft Entra-autentisering (tidigare Azure Active Directory). Mer information finns i Översikt över Document Intelligence Studio.
Februari 2024
Rest-API:et för dokumentinformation 2024-07-31-preview är nu tillgängligt. Det här förhandsversions-API:et introducerar nya och uppdaterade funktioner:
Förhandsversion 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner:
- USA, östra
- USA, västra 2
- Europa, västra
Layoutmodellen stöder nu bildidentifiering och hierarkisk dokumentstrukturanalys (avsnitt och underavsnitt). AI-kvaliteten för identifiering av läsordning och logiska roller förbättras också.
Anpassade extraheringsmodeller
- Anpassade extraheringsmodeller stöder nu konfidenspoäng på cell-, rad- och tabellnivå. Läs mer om konfidens för tabeller, rader och celler.
- Anpassade extraheringsmodeller har AI-kvalitetsförbättringar för fältextrahering.
- Den anpassade mallextraheringsmodellen stöder nu extrahering av överlappande fält. Läs mer om överlappande fält och hur du använder dem.
Anpassad klassificeringsmodell
- Anpassad klassificeringsmodell har nu stöd för inkrementell träning för scenarier där du behöver uppdatera klassificerarmodellen med tillagda exempel eller klasser. Läs mer om inkrementell träning.
- Anpassad klassificeringsmodell lägger till stöd för Office-dokumenttyper (.docx, .pptx och .xls). Läs mer om utökat stöd för dokumenttyper.
-
- Stöd för nya nationella inställningar:
Nationella inställningar Kod Arabiska ( ar
)Bulgariska ( bg
)Grekiska ( el
)Hebreiska ( he
)Makedonska ( mk
)Ryska ( ru
)Serbisk kyrillisk ( sr-cyrl
)Ukrainska ( uk
)Thailändska ( th
)Turkiska ( tr
)Vietnamesiska ( vi
)- Stöd för nya valutakoder:
Valuta Nationella inställningar Kod BAM
Bosnisk konvertibel mark ( ba
)BGN
Bulgariska Lev ( bg
)ILS
Israeliska nya Shekel ( il
)MKD
Makedonska denar ( mk
)RUB
Ryska rubel ( ru
)THB
Thai Baht ( th
)TRY
Turkisk lira ( tr
)UAH
Ukrainska Hryvnia ( ua
)VND
Vietnamesisk dong ( vn
)- Skatteposter stöder expansion för Tyskland (
de
), Spanien (es
), Portugal (pt
), Engelska Kanadaen-CA
.
-
- Utökat fältstöd för EU-ID:er och körkort.
-
- Extrahera information från Uniform Residential Loan Application (formulär 1003).
- Extrahera information från enhetlig underskrift och överföringssammanfattning eller formulär 1008.
- Extrahera information från upplysning om stängning av bolån.
-
- Extrahera information från bankkort.
-
- Ny fördefinierade för att extrahera information från äktenskapscertifikat.
December 2023
Dokumentinformationsklientbiblioteken för REST API 2023-10-31-preview är nu tillgängliga för användning!
November 2023
Rest-API:et för document intelligence 2023-10-31-preview är nu tillgängligt. Det här förhandsversions-API:et introducerar nya och uppdaterade funktioner:
Förhandsversion 2023-10-31-preview är för närvarande endast tillgänglig i följande Azure-regioner:
- USA, östra
- USA, västra 2
- Europa, västra
-
- Språkexpansion för handskrift: Russian(
ru
), Arabic(ar
), Thai(th
). - Efterlevnad av Cyber Executive Order (EO).
- Språkexpansion för handskrift: Russian(
-
- Stöd för Office- och HTML-filer.
- Stöd för Markdown-utdata.
- Förbättringar av tabellextrahering, läsordning och avsnittsrubrikidentifiering.
- Med document intelligence 2023-10-31-preview är den allmänna dokumentmodellen (fördefinierade dokumentet) inaktuell. Om du vill extrahera nyckel/värde-par från dokument
prebuilt-layout
använder du modellen med den valfria frågesträngsparameternfeatures=keyValuePairs
aktiverad.
-
- Extraherar nu valuta för alla prisrelaterade fält.
Modell för sjukförsäkringskort
- Nytt fältstöd för Medicare- och Medicaid-information.
Modeller för amerikanska skattedokument
- Ny skattemodell från 1099. Stöder basformuläret 1099 och följande varianter: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Stöd för
KVK
fält. - Stöd för
BPAY
fält. - Många fältförfiningar.
- Stöd för
-
- Stöd för dokument med flera språk.
- Nya alternativ för siddelning: autosplit, dela alltid efter sida, ingen delning.
-
- Frågefält är tillgängliga med versionen
2023-10-31-preview
. - Tilläggsfunktioner är tillgängliga i alla modeller förutom Läs-modellen.
- Frågefält är tillgängliga med versionen
Kommentar
Med versionen 2022-08-31 API general availability (GA) är de associerade förhandsversions-API:erna inaktuella. Om du använder 2021-09-30-preview, API-versionerna 2022-01-30-preview eller 2022-06-30-preview uppdaterar du dina program så att de riktar in sig på API-versionen 2022-08-31. Det finns några mindre ändringar, mer information finns i migreringsguiden.
juli 2023
Kommentar
Formigenkänning är nu Azure AI Document Intelligence!
- Dokument: Azure AI-tjänster omfattar allt som tidigare kallades Cognitive Services och Azure Applied AI Services.
- Det finns inga ändringar i prissättningen.
- Namnen Cognitive Services och Azure Applied AI fortsätter att användas i Azure-fakturering, kostnadsanalys, prislista och pris-API:er.
- Det finns inga icke-bakåtkompatibla ändringar i programprogramprogramgränssnitt (API:er) eller klientbibliotek.
- Vissa plattformar väntar fortfarande på uppdatering av namnbytet. Alla omnämnanden av Formigenkänning eller dokumentinformation i vår dokumentation avser samma Azure-tjänst.
Dokumentinformation v3.1 (GA)
Api:et för Dokumentinformation version 3.1 är nu allmänt tillgängligt (GA)! API-versionen motsvarar 2023-07-31
.
V3.1-API:et introducerar nya och uppdaterade funktioner:
- API:er för dokumentinformation är nu mer modulära och har stöd för valfria funktioner. Nu kan du anpassa utdata för att specifikt inkludera de funktioner du behöver. Läs mer om de valfria parametrarna.
- API för dokumentklassificering för att dela upp en enskild fil i enskilda dokument. Läs mer om dokumentklassificering.
- Fördefinierad kontraktsmodell.
- Fördefinierad amerikansk skatteform 1098-modell.
- Stöd för Office-filtyper med Läs-API.
- Streckkodsigenkänning i dokument.
- Tilläggsfunktion för formeligenkänning.
- Tilläggsfunktion för teckensnittsigenkänning.
- Stöd för dokument med hög upplösning.
- Anpassade neurala modeller kräver nu ett enda märkt exempel för att träna.
- Språkexpansion för anpassade neurala modeller. Träna en neural modell för dokument på 30 språk. Se språkstöd för den fullständiga listan över språk som stöds.
- 🆕 Fördefinierade sjukförsäkring kort modell.
- Fördefinierad expansion av fakturamodellspråk.
- Fördefinierade kvittomodellspråk och språkvariantexpansion med fler än 100 språk som stöds.
- Den fördefinierade ID-modellen stöder nu europeiska ID:er.
UX-uppdateringar för Document Intelligence Studio
✔️ Analysera alternativ
Dokumentinformation stöder nu mer avancerade analysfunktioner och Studio tillåter en startpunkt (knappen Analysera alternativ) för att enkelt konfigurera tilläggsfunktionerna.
Beroende på scenariot för dokumentextrahering konfigurerar du analysintervallet, dokumentsidans intervall, valfri identifiering och premiumidentifieringsfunktioner.
Kommentar
Extrahering av teckensnitt visualiseras inte i Document Intelligence Studio. Du kan dock kontrollera formatmallsavsnittet i JSON-utdata för att se resultatet av teckensnittsidentifieringen.
✔️ Automatisk etikettering av dokument med fördefinierade modeller eller en av dina egna modeller
På sidan med anpassade extraheringsmodeller kan du nu automatiskt märka dina dokument med någon av de fördefinierade modellerna eller modellerna i Document Intelligent Service som du tidigare har tränat.
För vissa dokument kan det finnas dubbletter av etiketter när den automatiska etiketten har körts. Se till att ändra etiketterna så att det inte finns några dubblettetiketter på etikettsidan efteråt.
✔️ Tabeller för automatisk etikettering
På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka tabellerna i dokumentet utan att behöva märka tabellerna manuellt.
✔️ Lägga till testfiler direkt i din träningsdatauppsättning
När du har tränat en anpassad extraheringsmodell använder du testsidan för att förbättra modellkvaliteten genom att ladda upp testdokument till träningsdatauppsättningen om det behövs.
Om en låg konfidenspoäng returneras för vissa etiketter kontrollerar du att etiketterna är korrekta. Om inte lägger du till dem i träningsdatauppsättningen och ometiketter för att förbättra modellkvaliteten.
✔️ Använd alternativen och filtren för dokumentlistan i anpassade projekt
Använd etiketteringssidan för den anpassade extraheringsmodellen. Nu kan du enkelt navigera i dina träningsdokument genom att använda sökning, filter och sortering efter funktion.
Använd rutnätsvyn för att förhandsgranska dokument eller använda listvyn för att rulla igenom dokumenten enklare.
✔️ Projektdelning
- Dela anpassade extraheringsprojekt med lätthet. Mer information finns i Projektdelning med anpassade modeller.
maj 2023
Introduktion till uppdaterad dokumentation för Build 2023
🆕 Översikt över dokumentinformation förbättrad navigering, strukturerade åtkomstpunkter och berikade bilder.
🆕 Välj en dokumentinformationsmodell ger vägledning för att välja den bästa lösningen för dokumentinformation för dina projekt och arbetsflöden.
April 2023
Tillkännagivande av den senaste offentliga förhandsversionen av Document Intelligence-klientbiblioteket
Document Intelligence REST API Version 2023-02-28-preview har stöd för klientbiblioteken för den offentliga förhandsversionen. Den här versionen innehåller följande nya funktioner som är tillgängliga för .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) och Python (3.3.0b.1) klientbibliotek:
Mer information finns i Dokumentinformations-SDK (offentlig förhandsversion) och viktig information för mars 2023
Mars 2023
Viktigt!
2023-02-28-preview
funktioner är för närvarande endast tillgängliga i följande regioner:
- Västeuropa
- USA, västra 2
- USA, östra
- Anpassad klassificeringsmodell är en ny funktion i Dokumentinformation som börjar med API:et
2023-02-28-preview
. - Frågefältfunktioner som lagts till i den allmänna dokumentmodellen använder Azure OpenAI-modeller för att extrahera specifika fält från dokument. Prova funktionen Allmänna dokument med frågefält med hjälp av Document Intelligence Studio. Frågefält är för närvarande endast aktiva för resurser i
East US
regionen. - Tilläggsfunktioner:
- Extrahering av teckensnitt känns nu igen med API:et
2023-02-28-preview
. - Formelextrahering identifieras nu med API:et
2023-02-28-preview
. - Högupplösningsextrahering identifieras nu med API:et
2023-02-28-preview
.
- Extrahering av teckensnitt känns nu igen med API:et
- Uppdateringar av anpassad extraheringsmodell:
- Anpassad neural modell har nu stöd för tillagda språk för träning och analys. Träna neurala modeller för nederländska, franska, tyska, italienska och spanska.
- Den anpassade mallmodellen har nu en förbättrad funktion för signaturidentifiering.
- Uppdateringar av Document Intelligence Studio :
- Förutom stöd för alla nya funktioner som klassificerings- och frågefält möjliggör Studio nu projektdelning för anpassade modellprojekt.
- Nya modelltillägg i gated preview: Vaccinationskort, Contracts, US Tax 1098, US Tax 1098-E och US Tax 1098-T. Om du vill begära åtkomst till gated preview-modeller fyller du i och skickar formuläret för privat förhandsgranskning av dokumentinformation.
- Uppdateringar av kvittomodell:
- Kvittomodellen lägger till stöd för termiska kvitton.
- Kvittomodellen lägger nu till språkstöd för 18 språk och tre regionala språk (engelska, franska, portugisiska).
- Kvittomodellen stöder
TaxDetails
nu extrahering.
- Layoutmodellen förbättrar nu tabelligenkänningen.
- Läsmodellen ger nu förbättringar för ensiffrig teckenigenkänning.
2023 februari
Välj Dokumentinformationscontainrar för v3.0 är nu tillgängliga för användning!
För närvarande är Containrar för Läs v3.0 och Layout v3.0 tillgängliga.
Mer information finns i Installera och köra dokumentinformationscontainrar.
Januari 2023
Fördefinierad kvittomodell – tillagda språk som stöds. Kvittomodellen har nu stöd för dessa tillagda språk och nationella inställningar
- Japanska – Japan (ja-JP)
- Franska – Kanada (fr-CA)
- Nederländska – Nederländerna (nl-NL)
- Engelska – Förenade Arabemiraten (en-AE)
- Portugisiska – Brasilien (pt-BR)
Fördefinierad fakturamodell – lade till språk som stöds. Fakturamodellen stöder nu dessa tillagda språk och nationella inställningar
- Engelska – USA (en-US), Australien (en-AU), Kanada (en-CA), Storbritannien (en-UK), Indien (en-IN)
- Spanska - Spanien (es-ES)
- Franska - Frankrike (fr-FR)
- Italienska – Italien (it-IT)
- Portugisiska – Portugal (pt-PT)
- Nederländska – Nederländerna (nl-NL)
Fördefinierad fakturamodell – tillagda fält som identifieras. Fakturamodellen känner nu igen de här tillagda fälten
- Valutakod
- Betalningsalternativ
- Total rabatt
- Skatteobjekt (endast en-IN)
Fördefinierad ID-modell – lade till dokumenttyper som stöds. ID-modellen stöder nu dessa tillagda dokumenttyper
- Amerikanskt militär-ID
Dricks
Alla uppdateringar för januari 2023 är tillgängliga med REST API version 2022-08-31 (GA).
Fördefinierad kvittomodell – ytterligare språkstöd:
Den fördefinierade kvittomodellen lägger till stöd för följande språk:
- Engelska – Förenade Arabemiraten (en-AE)
- Nederländska – Nederländerna (nl-NL)
- Franska – Kanada (fr-CA)
- Tyska - (de-DE)
- Italienska - (it-IT)
- Japanska – Japan (ja-JP)
- Portugisiska – Brasilien (pt-BR)
Fördefinierad fakturamodell – ytterligare språkstöd och fältextraheringar
Den fördefinierade fakturamodellen lägger till stöd för följande språk:
- Engelska - Australien (en-AU), Kanada (en-CA), Storbritannien (en-UK), Indien (en-IN)
- Portugisiska – Brasilien (pt-BR)
Den fördefinierade fakturamodellen lägger nu till stöd för följande fältextraheringar:
- Valutakod
- Betalningsalternativ
- Total rabatt
- Skatteobjekt (endast en-IN)
Fördefinierad ID-dokumentmodell – ytterligare stöd för dokumenttyper
Den fördefinierade ID-dokumentmodellen lägger nu till stöd för följande dokumenttyper:
- Expansion av körkort som stöder Indien, Kanada, Storbritannien och Australien
- Amerikanska militära ID-kort och dokument
- Indien ID-kort och dokument (PAN och Aadhaar)
- Australien ID-kort och dokument (fotokort, Nyckel-pass-ID)
- Kanada ID-kort och dokument (ID-kort, Maple-kort)
- ID-kort och dokument i Storbritannien (nationellt/regionalt identitetskort)
December 2022
Uppdateringar av Document Intelligence Studio
Document Intelligence Studio-versionen i december innehåller de senaste uppdateringarna av Document Intelligence Studio. Det finns betydande förbättringar av användarupplevelsen, främst med stöd för anpassad modelletikettering.
Sidintervall. Studio stöder nu analys av angivna sidor från ett dokument.
Anpassad modelletikettering:
Kör layout-API:et automatiskt. Du kan välja att köra layout-API:et för alla dokument automatiskt i bloblagringen under konfigurationsprocessen för den anpassade modellen.
Söka. Studio innehåller nu sökfunktioner för att hitta ord i ett dokument. Den här förbättringen möjliggör enklare navigering vid etikettering.
Navigering. Du kan välja etiketter som mål för etiketterade ord i ett dokument.
Automatisk tabelletikettering. När du har valt tabellikonen i ett dokument kan du välja att automatiskt märka den extraherade tabellen i etikettvyn.
Etikettundertyper och undertyper på andra nivån Studio stöder nu undertyper för tabellkolumner, tabellrader och undertyper på andra nivån för typer som datum och tal.
Det finns nu stöd för att skapa anpassade neurala modeller i regionen US Gov Virginia.
Förhandsversioner av API:et
2022-01-30-preview
och2021-09-30-preview
dras tillbaka den 31 januari 2023. Uppdatera till API-versionen2022-08-31
för att undvika avbrott i tjänsten.
November 2022
- Vi presenterar den senaste stabila versionen av Azure AI Document Intelligence-bibliotek
- Den här versionen innehåller viktiga ändringar och uppdateringar för .NET-, Java-, JavaScript- och Python-klientbibliotek. Mer information finns i Azure SDK DevBlog.
- De viktigaste förbättringarna är introduktionen av två nya klienter,
DocumentAnalysisClient
ochDocumentModelAdministrationClient
.
Oktober 2022
Innehåll med version av dokumentinformation
Dokumentationen om dokumentinformation uppdateras för att presentera en version av upplevelsen. Nu kan du välja att visa innehåll som är inriktat på
v3.0 GA
upplevelsen ellerv2.1 GA
upplevelsen. V3.0-upplevelsen är standard.
Exempelkod för Document Intelligence Studio
- Exempelkod för Document Intelligence Studio-etiketteringsfunktionen är nu tillgänglig på GitHub. Kunder kan utveckla och integrera dokumentinformation i sitt eget UX eller skapa ett eget nytt UX med hjälp av Exempelkoden för Document Intelligence Studio.
Språkexpansion
- Med den senaste förhandsversionen stöder Modeller för dokumentinformationsläsning (OCR), layout och anpassade mallar 134 nya språk. Dessa språktillägg inkluderar grekiska, lettiska, serbiska, thailändska, ukrainska och vietnamesiska, tillsammans med flera latinska och kyrilliska språk. Dokumentinformation har nu totalt 299 språk som stöds i de senaste ga- och nya förhandsversionerna. Se de språksidor som stöds för att se alla språk som stöds.
- Använd REST API-parametern
api-version=2022-06-30-preview
när du använder API:et eller motsvarande SDK för att stödja de nya språken i dina program.
Ny fördefinierad kontraktsmodell
- En ny fördefinierade som extraherar information från kontrakt som parter, titel, kontrakt-ID, körningsdatum med mera. kontraktmodellen är för närvarande i förhandsversion och begär åtkomst här.
Regionexpansion för träning av anpassade neurala modeller
- Träning av anpassade neurala modeller stöds nu i tillagda regioner.
- East US
- USA, östra 2
- US Gov, Arizona
- Träning av anpassade neurala modeller stöds nu i tillagda regioner.
September 2022
Kommentar
Från och med version 4.0.0 har en ny uppsättning klienter introducerats för att utnyttja de senaste funktionerna i document intelligence-tjänsten.
SDK version 4.0.0 GA innehåller följande uppdateringar:
- Version 4.0.0 GA (2022-09-08)
- Stöder REST API v3.0- och v2.0-klienter
Regionexpansion för träning av anpassade neurala modeller stöds nu i sex nya regioner
- Australien, östra
- Central US
- Asien, östra
- Frankrike, centrala
- Södra Storbritannien
- USA, västra 2
En fullständig lista över regioner där träning stöds finns i anpassade neurala modeller.
Version av Document Intelligence SDK
4.0.0 GA
:- Dokumentinformationsklientbibliotek version 4.0.0 (.NET/C#, Java, JavaScript) och version 3.2.0 (Python) är allmänt tillgängliga och redo att användas i produktionsprogram!.
- Mer information om dokumentinformationsklientbibliotek finns i SDK-översikten.
- Uppdatera dina program med hjälp av programmeringsspråkets migreringsguide.
Augusti 2022
Förhandsversionen av Document Intelligence SDK beta augusti 2022 innehåller följande uppdateringar:
Version 4.0.0-beta.5 (2022-08-09)
Dokumentinformation v3.0 allmänt tillgänglig
- Document Intelligence REST API v3.0 är nu allmänt tillgängligt och redo för användning i produktionsprogram! Uppdatera dina program med REST API version 2022-08-31.
Uppdateringar av Document Intelligence Studio
- Nästa steg. Under varje modellsida har Studio nu ett nästa steg-avsnitt. Användare kan snabbt referera till exempelkod, felsökningsriktlinjer och prisinformation.
- Anpassade modeller. Studio innehåller nu möjligheten att ändra ordning på etiketter i anpassade modellprojekt för att förbättra etiketteffektiviteten.
- Kopiera modeller Anpassade modeller kan kopieras mellan dokumentinformationstjänster från Studio. Åtgärden möjliggör befordran av en tränad modell till andra miljöer och regioner.
- Ta bort dokument. Studio stöder nu borttagning av dokument från etiketterade datamängder i anpassade projekt.
Uppdateringar av dokumentinformationstjänsten
- prebuilt-read. Läs OCR-modellen är nu också tillgänglig i Dokumentinformation med stycken och språkidentifiering som de två nya funktionerna. Document Intelligence Read riktar in sig på avancerade dokumentscenarier som är anpassade till de bredare funktionerna för dokumentinformation i Dokumentinformation.
- fördefinierad layout. Layoutmodellen extraherar stycken och huruvida den extraherade texten är ett stycke, rubrik, avsnittsrubrik, fotnot, sidhuvud, sidfot eller sidnummer.
- fördefinierad faktura. Fälten TotalVAT och Line/VAT matchas nu till de befintliga fälten TotalTax respektive Line/Tax.
- prebuilt-idDocument. Stöd för dataextrahering för amerikanska tillstånds-ID, social trygghet och gröna kort. Stöd för information om passvisum.
- förinställt kvitto. Utökat språkstöd för franska (fr-FR), spanska (es-ES), portugisiska (pt-PT), italienska (it-IT) och tyska (de-DE).
- prebuilt-businessCard. Stöd för adressparse för att extrahera underfält för adresskomponenter som adress, ort, delstat, land/region och postnummer.
Förbättringar av AI-kvalitet
- prebuilt-read. Förbättrat stöd för enstaka tecken, handskrivna datum, belopp, namn, andra viktiga data som ofta finns i kvitton och fakturor samt förbättrad bearbetning av digitala PDF-dokument.
- fördefinierad layout. Stöd för bättre identifiering av beskurna tabeller, kantlösa tabeller och förbättrad igenkänning av långa celler.
- prebuilt-document. Förbättrad värde- och kryssruteidentifiering.
- custom-neural. Förbättrad noggrannhet för tabellidentifiering och extrahering.
Juni 2022
- Förhandsversionen av Document Intelligence SDK beta juni 2022 innehåller följande uppdateringar:
Version 4.0.0-beta.4 (2022-06-08)
Document Intelligence Studio Juni-versionen är den senaste uppdateringen av Document Intelligence Studio. Det finns betydande användarupplevelse och hjälpmedelsförbättringar som åtgärdas i den här uppdateringen:
- Kodexempel för JavaScript och C#. Fliken Studio-kod lägger nu till JavaScript- och C#-kodexempel utöver det befintliga Python-kodexemplet.
- Nytt användargränssnitt för dokumentuppladdning. Studio stöder nu uppladdning av ett dokument med dra och släpp till det nya uppladdningsanvändargränssnittet.
- Ny funktion för anpassade projekt. Anpassade projekt har nu stöd för att skapa lagringskonto och blobar när projektet konfigureras. Dessutom stöder anpassat projekt nu uppladdning av träningsfiler direkt i Studio och kopiering av den befintliga anpassade modellen.
Document Intelligence v3.0 2022-06-30-preview release presenterar omfattande uppdateringar i funktions-API:erna:
- Layouten utökar strukturextraheringen. Layouten innehåller nu tillagda strukturelement, inklusive avsnitt, avsnittsrubriker och stycken. Den här uppdateringen möjliggör mer detaljerade scenarier för segmentering av dokument. En fullständig lista över identifierade strukturelement finns i Förbättrad struktur.
- Stöd för anpassade tabellfält för neural modell. Anpassade dokumentmodeller stöder nu tabellfält. Tabellfält är som standard också flera sidor. Mer information om tabellfält i anpassade neurala modeller finns i tabellfält.
- Stöd för tabellfält för anpassad mallmodell för tabeller mellan sidor. Anpassade formulärmodeller stöder nu tabellfält mellan sidor. Mer information om tabellfält i anpassade mallmodeller finns i tabellfält.
- Fakturamodellutdata innehåller nu allmänna nyckel/värde-par för dokument. Om fakturor innehåller obligatoriska fält utöver de fält som ingår i den fördefinierade modellen kompletterar den allmänna dokumentmodellen utdata med nyckel/värde-par. Se nyckelvärdepar.
- Utökning av fakturaspråk. Fakturamodellen innehåller utökat språkstöd. Se språk som stöds.
- Fördefinierade visitkort innehåller nu stöd för japanska. Se språk som stöds.
- Fördefinierad ID-dokumentmodell. ID-dokumentmodellen extraherar nu DateOfIssue, Height, Weight, EyeColor, HairColor och DocumentDiscriminator från amerikanska körkort. Se extrahering av fält.
- Läsmodellen har nu stöd för vanliga Dokumenttyper i Microsoft Office. Dokumenttyper som Word (docx), Excel (xlsx) och PowerPoint (pptx) stöds nu med läs-API:et. Se Läs extrahering av data.
Februari 2022
Version 4.0.0-beta.3 (2022-02-10)
Förhandsversionen av Document Intelligence v3.0 introducerar flera nya funktioner, funktioner och förbättringar:
- Anpassad neural modell eller anpassad dokumentmodell är en ny anpassad modell för att extrahera text- och urvalsmarkeringar från strukturerade formulär, halvstrukturerade och ostrukturerade dokument.
- Den fördefinierade W-2-modellen är en ny fördefinierad modell för att extrahera fält från W-2-formulär för scenarier för skatterapportering och inkomstverifiering.
- Läs-API extraherar tryckta textrader, ord, textplatser, identifierade språk och handskriven text om det upptäcks.
- Den allmänna modellen för förträning av dokument har nu uppdaterats för att stödja urvalsmarkeringar utöver API-text, tabeller, struktur och nyckel/värde-par från formulär och dokument.
- Den fördefinierade fakturamodellen faktura-API :et utökar stödet till spanska fakturor.
- Document Intelligence Studio lägger till nya demonstrationer för Read, W2, Hotel-kvittoexempel och stöd för träning av de nya anpassade neurala modellerna.
- Språkexpansion Dokumentinformation Läs, Layout och Anpassat formulär lägger till stöd för 42 nya språk, inklusive arabiska, hindi och andra språk med hjälp av arabiska och Devanagari-skript för att utöka täckningen till 164 språk. Stöd för handskrivna språk utökas till japanska och koreanska.
Kom igång med det nya förhandsversions-API:et v3.0.
Extrahering av dokumentinformationsmodelldata:
Modell Extrahering av text Nyckel/värde-par Markeringsmarkeringar Tabeller Signaturer Lästa ✓ Allmänt dokument ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ Faktura ✓ ✓ ✓ ✓ Kvitto ✓ ✓ ✓ ID-dokument ✓ ✓ Visitkort ✓ ✓ Anpassad mall ✓ ✓ ✓ ✓ ✓ Anpassad neural ✓ ✓ ✓ ✓ Förhandsversionen av Document Intelligence SDK beta innehåller följande uppdateringar:
Anpassade dokumentmodeller och lägen:
- Anpassad mall (tidigare anpassat formulär).
- Anpassad neural.
- Anpassad modell – byggläge.
W-2 fördefinierad modell (prebuilt-tax.us.w2).
Läs den fördefinierade modellen (fördefinierad läsning).
Fakturafördefinierade modell (spanska) (fördefinierad faktura).
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.
Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.