Modelli di elaborazione di documenti
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
- La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
- Stati Uniti centro-settentrionali
Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti: v3.1 (disponibilità generale) v3.0 (disponibilità generale) v2.1 (disponibilità generale)
Questo contenuto si applica a: v3.1 (disponibilità generale) | Versione più recente: v4.0 (anteprima) | Versioni precedenti: v3.0 v2.1
Questo contenuto si applica a: v3.0 (disponibilità generale) | Versioni più recenti: v4.0 (anteprima) v3.1 | Versione precedente: v2.1
Questo contenuto si applica a: v2.1 | Versione più recente: v4.0 (anteprima)
Informazioni sui documenti di Azure AI supporta un'ampia gamma di modelli che consentono di aggiungere funzionalità di elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello specifico del dominio oppure eseguire il training di un modello personalizzato in base alle esigenze aziendali e ai casi d'uso specifici. Informazioni sui documenti può essere usato con l'API REST o le librerie client Python, C#, Java e JavaScript.
Nota
- I progetti di elaborazione dei documenti che coinvolgono dati finanziari, dati sanitari protetti, dati personali o dati altamente sensibili richiedono un'attenzione particolare.
- Assicurarsi di rispettare tutti i requisiti nazionali/regionali e specifici del settore.
Panoramica dei modelli
La tabella seguente illustra i modelli disponibili per ogni anteprima corrente e l'API stabile:
Tipo di modello | Modello | 29-02-2024-anteprima • 31-10.2023-anteprima |
31-07-2023 - (DISPONIBILITÀ GENERALE) | 2022-08-31 (Disponibilità generale) | v2.1 (DISPONIBILITÀ GENERALE) |
---|---|---|---|---|---|
Modelli di analisi dei documenti | Lettura | ✔️ | ✔️ | ✔️ | n/d |
Modelli di analisi dei documenti | Layout | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli di analisi dei documenti | Documento generale | spostato nel layout** | ✔️ | ✔️ | n/d |
Modelli predefiniti | Assegno bancario | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Rendiconto bancario | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Paystub | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Contratto | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Tessera sanitaria | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | Documento di identità | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Fattura | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Ricevuta | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Imposta USA unificata* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Imposta statunitense 1040* | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Imposta statunitense 1098* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Imposta statunitense 1099* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Imposta statunitense W2 | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | Ipoteca statunitense 1003 URLA | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Mutuo 1004 Stati Uniti URAR | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Mutuo 1005 Stati Uniti | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Riepilogo ipoteca statunitense 1008 | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Informativa sulla chiusura delle ipoteche statunitensi | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Certificato di matrimonio | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Carta di credito | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Biglietto da visita | deprecated | ✔️ | ✔️ | ✔️ |
Modello di classificazione personalizzato | Classificatore personalizzato | ✔️ | ✔️ | n/d | n/d |
Modello generativo personalizzato | Modello generativo personalizzato | ✔️ | n/d | n/d | n/d |
Modello di estrazione personalizzato | Neurale personalizzato | ✔️ | ✔️ | ✔️ | n/d |
Modello customextraction | Modello personalizzato | ✔️ | ✔️ | ✔️ | ✔️ |
Modello di estrazione personalizzato | Composto personalizzato | ✔️ | ✔️ | ✔️ | ✔️ |
Tutti i modelli | Funzionalità dei componenti aggiuntivi | ✔️ | ✔️ | n/d | n/d |
* - Contiene sottomodelli. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.
Latenza
La latenza è il tempo necessario per un server API per gestire ed elaborare una richiesta in ingresso e recapitare la risposta in uscita al client. Il tempo necessario per analizzare un documento dipende dalle dimensioni, ad esempio il numero di pagine, e dal contenuto associato in ogni pagina. Informazioni sui documenti è un servizio multi-tenant in cui la latenza per documenti simili è paragonabile, ma non sempre identica. La variabilità occasionale in termini di latenza e prestazioni è intrinseca nei servizi asincroni senza stato basati su microservizi che elaborano immagini e documenti di grandi dimensioni su larga scala. Anche se l'hardware, la capacità e le funzionalità di ridimensionamento vengono continuamente aumentati, è possibile che si verifichino ancora problemi di latenza in fase di esecuzione.
Funzionalità del componente aggiuntivo | Componente aggiuntivo/gratuito | 29-02-2024-anteprima &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Estrazione delle proprietà dei caratteri | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione di formule | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione ad alta risoluzione | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione del codice a barre | Gratuito | ✔️ | ✔️ | n/d | n/d |
Rilevamento lingua | Gratuito | ✔️ | ✔️ | n/d | n/d |
Coppie chiave-valore | Gratuito | ✔️ | n/d | n/d | n/d |
Campi di query | Componente aggiuntivo* | ✔️ | n/d | n/d | n/d |
PDF ricercabile | Componente aggiuntivo* | ✔️ | n/d | n/d | n/d |
Funzionalità dell'analisi dei modelli
Model ID | Estrazione di contenuto | Campi di query | Paragrafi | Ruoli di paragrafo | Segni di selezione | Tabelle | Coppie chiave-valore | Lingue | Codici a barre | Analisi dei documenti | Formule* | Carattere stile* | Alta risoluzione* | PDF ricercabile |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | ✓ | O | O | O | O | O | ✓ | ||||||
prebuilt-layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-businessCard | ✓ | ✓ | ✓ | |||||||||||
prebuilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1004 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1005 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099(varianti) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1040(varianti) | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Abilitato
O - facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi
Componente aggiuntivo* - I campi di query vengono distribuiti in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per informazioni dettagliate, vedere i prezzi.
Rettangolo delimitatore e coordinate poligono
Un rettangolo delimitatore (polygon
in versione 3.0 e versioni successive) è un rettangolo astratto che circonda gli elementi di testo in un documento usato come punto di riferimento per il rilevamento degli oggetti.
Il rettangolo di selezione specifica la posizione usando un piano di coordinate x e y presentato in una matrice di quattro coppie numeriche. Ogni coppia rappresenta un angolo della casella nell'ordine seguente: in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra.
Le coordinate per un'immagine sono in pixel. Per un PDF, le coordinate sono presentate in pollici.
Per tutti i modelli, ad eccezione del modello di biglietto da visita, Informazioni sui documenti supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. Queste funzionalità facoltative possono essere abilitate e disabilitate a seconda dello scenario di estrazione dei documenti. Sono disponibili sette funzionalità aggiuntive per 2023-07-31
(DISPONIBILITÀ GENERALE) e versioni successive dell'API:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(29-02-2024-anteprima, 31-10-2023-anteprima)queryFields
(29-02-2024-anteprima, 31-10-2023-anteprima)Not available with the US.Tax models
searchablePDF
(2024-07-31-preview)Only available for Read Model
Supporto di versioni in lingue diverse
I modelli universali basati su Deep Learning di Informazioni sui documenti supportano molte lingue che possono estrarre testo multilingue dalle immagini e dai documenti, incluse le righe di testo con lingue miste. Il supporto linguistico varia in base alla funzionalità del servizio Informazioni sui documenti. Per l'elenco completo, vedere i seguenti articoli:
- Supporto per la lingua: modelli di analisi dei documenti
- Supporto per la lingua: modelli predefiniti
- Supporto per la lingua: modelli personalizzati
Disponibilità a livello di area
Informazioni sui documenti è disponibile a livello generale in molte delle oltre 60 aree di infrastruttura globale di Azure.
Per altre informazioni, vedere la pagina aree geografiche di Azure per scegliere l'area migliore per l'utente e i clienti.
Dettagli del modello
Questa sezione descrive l'output previsto da ogni modello. È possibile estendere l'output della maggior parte dei modelli con funzionalità del componente aggiuntivo.
Read OCR
L'API Lettura analizza ed estrae righe, parole, posizioni, lingue rilevate e stile scritto a mano, se rilevato.
Documento di esempio elaborato usando Document Intelligence Studio:
Analisi del layout
Il modello di analisi del layout consente di analizzare ed estrarre testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina, piè di pagina e altro ancora.
Documento di esempio elaborato con Document Intelligence Studio:
Modello di tessera di assicurazione sanitaria
Il modello di tessera sanitaria combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle tessere sanitarie USA.
Tessera sanitaria USA di esempio elaborata con Document Intelligence Studio:
Documenti fiscali statunitensi
I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Imposta statunitense W-2 | Estrae i dettagli della retribuzione imponibile. | prebuilt-tax.us.w2 |
Imposta statunitense 1040 | Estrae i dettagli degli interessi ipotecari. | prebuilt-tax.us.1040(varianti) |
Imposta statunitense 1098 | Estrae i dettagli degli interessi ipotecari. | prebuilt-tax.us.1098(varianti) |
Imposta USA 1099 | Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro. | prebuilt-tax.us.1099(varianti) |
Documento di esempio W-2 elaborato con Document Intelligence Studio:
Documenti ipotecari statunitensi
I modelli di documento ipotecario statunitense analizzano ed estraggono i campi chiave, inclusi i mutuatari, i prestiti e le informazioni sulle proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Contratto di licenza con l'utente finale 1003 (EULA) | Estrarre prestiti, mutuatari, dettagli di proprietà. | prebuilt-mortgage.us.1003 |
Documento di riepilogo 1008 | Estrarre i dettagli del mutuatario, del venditore, della proprietà, del mutuo e della sottoscrizione. | prebuilt-mortgage.us.1008 |
Informativa sulla chiusura | Estrarre i dettagli di chiusura, transazioni e prestito. | prebuilt-mortgage.us.closingDisclosure |
Certificato di matrimonio | Estrarre i dettagli relativi al matrimonio per i richiedenti prestiti comuni. | prebuilt-marriageCertificate |
Imposta statunitense W-2 | Estrarre i dettagli del risarcimento fiscale per la verifica del reddito. | prebuilt-tax.us.w2 |
Documento di esempio di informativa sulla chiusura elaborato con Document Intelligence Studio:
Contract
Il modello di contratto analizza ed estrae i campi chiave e gli elementi riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.
Contratto di esempio elaborato con Document Intelligence Studio:
Fattura
Il modello di fattura consente di automatizzare l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto, le voci e altri dati chiave. Attualmente, il modello supporta fatture in inglese, spagnolo, tedesco, francese, italiano, portoghese e olandese.
Fattura di esempio elaborata con Document Intelligence Studio:
Ricevuta
Usare il modello di ricevuta per digitalizzare le ricevute di vendita ed estrarre il nome del commerciante, le date, le voci, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione delle ricevute di hotel a pagina singola.
Ricevuta di esempio elaborata con Document Intelligence Studio:
Documento di identità (ID)
Usare il modello documento di identità (ID) per elaborare le patenti di guida USA (tutti i 50 stati e District of Columbia) e le pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio) al fine di estrarre i campi chiave.
Esempio degli Stati Uniti. Patente di guida elaborata utilizzando Document Intelligence Studio:
Certificato di matrimonio
Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre campi chiave, tra cui le persone, la data e l’area geografica.
Certificato di matrimonio statunitense di esempio elaborata con Document Intelligence Studio:
Carta di credito
Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.
Carta di credito di esempio elaborata con Document Intelligence Studio:
Modelli personalizzati
I modelli personalizzati possono essere classificati a grandi linee in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.
I modelli di documenti personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. Riconoscono i campi moduli all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, è necessario solo un esempio del tipo di modulo.
I modelli personalizzati della versione v3.0 e successive supporta il rilevamento delle firme nei modelli personalizzati (modulo) e nelle tabelle tra pagine sia nei modelli di tipo modello che nei modelli neurali. Il rilevamento della firma verifica se è presente una firma, non verifica l'identità della persona che firma il documento. Se il modello restituisce unsigned per il rilevamento delle firme, il modello non ha trovato una firma nel campo definito.
Modello personalizzato di esempio elaborato con Document Intelligence Studio:
Estrazione personalizzata
Il modello di estrazione personalizzato può essere uno dei due tipi, modello personalizzato o neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello sul set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.
Estrazione personalizzata di esempio elaborata con Document Intelligence Studio:
Classificatore personalizzato
Il modello di classificazione personalizzato consente di identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA)
. Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque esempi per classe.
Modelli composti
Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 200 modelli personalizzati sottoposti a training.
Finestra di dialogo Modello composto in Document Intelligence Studio:
Requisiti di input
Formati di file supportati:
Modello PDF Immagine: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e
4
MB per il livello gratuito (F0).Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e
1
GB per il modello neurale.Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1
GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono2
GB con un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.
Migrazione della versione
Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo Guida alla migrazione di Informazioni sui documenti v3.1
Modello | Descrizione |
---|---|
Analisi dei documenti | |
Layout | Estrarre testo e informazioni sul layout dai documenti. |
Predefinita | |
Fattura | Estrarre le informazioni chiave dalle fatture in inglese e spagnolo. |
Ricevuta | Estrarre le informazioni chiave dalle ricevute in inglese. |
Documento di identità | Estrarre le informazioni chiave da patenti di guida USA e passaporti internazionali. |
Biglietto da visita | Estrarre le informazioni chiave dai biglietti da visita in inglese. |
Personalizzazione | |
Personalizzazione | Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici. |
Modello composto | Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello creato dai tipi di modulo. |
Layout
L'API Layout consente di analizzare ed estrarre testo, tabelle e intestazioni, segni di selezione e informazioni sulla struttura dai documenti.
Documento di esempio elaborato con lo strumento di etichettatura di esempio:
Fattura
Il modello di fattura consente di analizzare ed estrarre le informazioni chiave dalle fatture di vendita. L'API consente di analizzare le fatture in vari formati e di estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto.
Fattura di esempio elaborata con lo strumento di etichettatura di esempio:
Ricevuta
- Il modello di ricevuta consente di analizzare ed estrarre le informazioni chiave dalle ricevute di vendita stampate e scritte a mano.
Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio:
Documento di identità
Il modello di documento di identità consente di analizzare ed estrarre le informazioni chiave dai documenti seguenti:
U.S. Patenti di guida USA (tutti i 50 stati e District of Columbia)
Pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio). L'API consente di analizzare i documenti e di estrarre
Esempio di patente di guida USA elaborato con lo strumento di etichettatura di esempio:
Carta aziendale
Il modello di biglietto da visita consente di analizzare ed estrarre le informazioni chiave dalle immagini dei biglietti da visita.
Biglietto da visita di esempio elaborato con lo strumento di etichettatura di esempio:
Personalizzazione
- I modelli personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. L'API è un programma di apprendimento automatico sottoposto a training per riconoscere campi modulo all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo ed è possibile eseguire il training del modello con o senza set di dati etichettati.
Elaborazione di modelli personalizzati di esempio con lo strumento di etichettatura di esempio:
Modello personalizzato composto
Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 100 modelli personalizzati con training.
Finestra di dialogo Modello composto con lo strumento di etichettatura di esempio:
Estrazione dei dati del modello
Modello | Estrazione di testo | Rilevamento lingua | Segni di selezione | Tabelle | Paragrafi | Ruoli di paragrafo | Coppie chiave-valore | Campi |
---|---|---|---|---|---|---|---|---|
Layout | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Fattura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Ricevuta | ✓ | ✓ | ✓ | |||||
Documento di identità | ✓ | ✓ | ✓ | |||||
Biglietto da visita | ✓ | ✓ | ✓ | |||||
Modulo personalizzato | ✓ | ✓ | ✓ | ✓ | ✓ |
Requisiti di input
Formati di file supportati:
Modello PDF Immagine: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e
4
MB per il livello gratuito (F0).Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e
1
GB per il modello neurale.Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1
GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono2
GB con un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.
Migrazione della versione
Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo Guida alla migrazione di Informazioni sui documenti v3.1
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Studio di Informazioni sui documenti.
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Informazioni sui documenti.
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.