Modelli di elaborazione di documenti

Importante

  • Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
  • Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
  • La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
    • Stati Uniti orientali
    • Stati Uniti occidentali 2
    • Europa occidentale
    • Stati Uniti centro-settentrionali

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale) blue-checkmark v2.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Versione più recente: purple-checkmark v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.0 blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Versioni più recenti: purple-checkmark v4.0 (anteprima) purple-checkmark v3.1 | Versione precedente: blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v2.1 | Versione più recente: blue-checkmark v4.0 (anteprima)

Informazioni sui documenti di Azure AI supporta un'ampia gamma di modelli che consentono di aggiungere funzionalità di elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello specifico del dominio oppure eseguire il training di un modello personalizzato in base alle esigenze aziendali e ai casi d'uso specifici. Informazioni sui documenti può essere usato con l'API REST o le librerie client Python, C#, Java e JavaScript.

Nota

  • I progetti di elaborazione dei documenti che coinvolgono dati finanziari, dati sanitari protetti, dati personali o dati altamente sensibili richiedono un'attenzione particolare.
  • Assicurarsi di rispettare tutti i requisiti nazionali/regionali e specifici del settore.

Panoramica dei modelli

La tabella seguente illustra i modelli disponibili per ogni anteprima corrente e l'API stabile:

Tipo di modello Modello 29-02-2024-anteprima
31-10.2023-anteprima
31-07-2023 - (DISPONIBILITÀ GENERALE) 2022-08-31 (Disponibilità generale) v2.1 (DISPONIBILITÀ GENERALE)
Modelli di analisi dei documenti Lettura ✔️ ✔️ ✔️ n/d
Modelli di analisi dei documenti Layout ✔️ ✔️ ✔️ ✔️
Modelli di analisi dei documenti Documento generale spostato nel layout** ✔️ ✔️ n/d
Modelli predefiniti Assegno bancario ✔️ n/d n/d n/d
Modelli predefiniti Rendiconto bancario ✔️ n/d n/d n/d
Modelli predefiniti Paystub ✔️ n/d n/d n/d
Modelli predefiniti Contratto ✔️ ✔️ n/d n/d
Modelli predefiniti Tessera sanitaria ✔️ ✔️ ✔️ n/d
Modelli predefiniti Documento di identità ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Fattura ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Ricevuta ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Imposta USA unificata* ✔️ n/d n/d n/d
Modelli predefiniti Imposta statunitense 1040* ✔️ ✔️ n/d n/d
Modelli predefiniti Imposta statunitense 1098* ✔️ n/d n/d n/d
Modelli predefiniti Imposta statunitense 1099* ✔️ n/d n/d n/d
Modelli predefiniti Imposta statunitense W2 ✔️ ✔️ ✔️ n/d
Modelli predefiniti Ipoteca statunitense 1003 URLA ✔️ n/d n/d n/d
Modelli predefiniti Mutuo 1004 Stati Uniti URAR ✔️ n/d n/d n/d
Modelli predefiniti Mutuo 1005 Stati Uniti ✔️ n/d n/d n/d
Modelli predefiniti Riepilogo ipoteca statunitense 1008 ✔️ n/d n/d n/d
Modelli predefiniti Informativa sulla chiusura delle ipoteche statunitensi ✔️ n/d n/d n/d
Modelli predefiniti Certificato di matrimonio ✔️ n/d n/d n/d
Modelli predefiniti Carta di credito ✔️ n/d n/d n/d
Modelli predefiniti Biglietto da visita deprecated ✔️ ✔️ ✔️
Modello di classificazione personalizzato Classificatore personalizzato ✔️ ✔️ n/d n/d
Modello generativo personalizzato Modello generativo personalizzato ✔️ n/d n/d n/d
Modello di estrazione personalizzato Neurale personalizzato ✔️ ✔️ ✔️ n/d
Modello customextraction Modello personalizzato ✔️ ✔️ ✔️ ✔️
Modello di estrazione personalizzato Composto personalizzato ✔️ ✔️ ✔️ ✔️
Tutti i modelli Funzionalità dei componenti aggiuntivi ✔️ ✔️ n/d n/d

* - Contiene sottomodelli. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.

Latenza

La latenza è il tempo necessario per un server API per gestire ed elaborare una richiesta in ingresso e recapitare la risposta in uscita al client. Il tempo necessario per analizzare un documento dipende dalle dimensioni, ad esempio il numero di pagine, e dal contenuto associato in ogni pagina. Informazioni sui documenti è un servizio multi-tenant in cui la latenza per documenti simili è paragonabile, ma non sempre identica. La variabilità occasionale in termini di latenza e prestazioni è intrinseca nei servizi asincroni senza stato basati su microservizi che elaborano immagini e documenti di grandi dimensioni su larga scala. Anche se l'hardware, la capacità e le funzionalità di ridimensionamento vengono continuamente aumentati, è possibile che si verifichino ancora problemi di latenza in fase di esecuzione.

Funzionalità del componente aggiuntivo Componente aggiuntivo/gratuito 29-02-2024-anteprima
&bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Estrazione delle proprietà dei caratteri Componente aggiuntivo ✔️ ✔️ n/d n/d
Estrazione di formule Componente aggiuntivo ✔️ ✔️ n/d n/d
Estrazione ad alta risoluzione Componente aggiuntivo ✔️ ✔️ n/d n/d
Estrazione del codice a barre Gratuito ✔️ ✔️ n/d n/d
Rilevamento lingua Gratuito ✔️ ✔️ n/d n/d
Coppie chiave-valore Gratuito ✔️ n/d n/d n/d
Campi di query Componente aggiuntivo* ✔️ n/d n/d n/d
PDF ricercabile Componente aggiuntivo* ✔️ n/d n/d n/d

Funzionalità dell'analisi dei modelli

Model ID Estrazione di contenuto Campi di query Paragrafi Ruoli di paragrafo Segni di selezione Tabelle Coppie chiave-valore Lingue Codici a barre Analisi dei documenti Formule* Carattere stile* Alta risoluzione* PDF ricercabile
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(varianti) O O O O O
prebuilt-tax.us.1040(varianti) O O O O O
{ customModelName } O O O O O

✓ - Abilitato
O - facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi

Componente aggiuntivo* - I campi di query vengono distribuiti in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per informazioni dettagliate, vedere i prezzi.

Rettangolo delimitatore e coordinate poligono

Un rettangolo delimitatore (polygon in versione 3.0 e versioni successive) è un rettangolo astratto che circonda gli elementi di testo in un documento usato come punto di riferimento per il rilevamento degli oggetti.

  • Il rettangolo di selezione specifica la posizione usando un piano di coordinate x e y presentato in una matrice di quattro coppie numeriche. Ogni coppia rappresenta un angolo della casella nell'ordine seguente: in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra.

  • Le coordinate per un'immagine sono in pixel. Per un PDF, le coordinate sono presentate in pollici.

Per tutti i modelli, ad eccezione del modello di biglietto da visita, Informazioni sui documenti supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. Queste funzionalità facoltative possono essere abilitate e disabilitate a seconda dello scenario di estrazione dei documenti. Sono disponibili sette funzionalità aggiuntive per 2023-07-31 (DISPONIBILITÀ GENERALE) e versioni successive dell'API:

Supporto di versioni in lingue diverse

I modelli universali basati su Deep Learning di Informazioni sui documenti supportano molte lingue che possono estrarre testo multilingue dalle immagini e dai documenti, incluse le righe di testo con lingue miste. Il supporto linguistico varia in base alla funzionalità del servizio Informazioni sui documenti. Per l'elenco completo, vedere i seguenti articoli:

Disponibilità a livello di area

Informazioni sui documenti è disponibile a livello generale in molte delle oltre 60 aree di infrastruttura globale di Azure.

Per altre informazioni, vedere la pagina aree geografiche di Azure per scegliere l'area migliore per l'utente e i clienti.

Dettagli del modello

Questa sezione descrive l'output previsto da ogni modello. È possibile estendere l'output della maggior parte dei modelli con funzionalità del componente aggiuntivo.

Read OCR

L'API Lettura analizza ed estrae righe, parole, posizioni, lingue rilevate e stile scritto a mano, se rilevato.

Documento di esempio elaborato usando Document Intelligence Studio:

Screenshot dello screenshot del documento di esempio elaborato con Document Intelligence Studio Read

Analisi del layout

Il modello di analisi del layout consente di analizzare ed estrarre testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina, piè di pagina e altro ancora.

Documento di esempio elaborato con Document Intelligence Studio:

Screenshot della pagina del giornale di esempio elaborata con Document Intelligence Studio Read.

Modello di tessera di assicurazione sanitaria

Il modello di tessera sanitaria combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle tessere sanitarie USA.

Tessera sanitaria USA di esempio elaborata con Document Intelligence Studio:

Screenshot di un esempio di analisi della scheda di assicurazione sanitaria degli Stati Uniti in Document Intelligence Studio.

Documenti fiscali statunitensi

I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:

Modello Descrizione ModelID
Imposta statunitense W-2 Estrae i dettagli della retribuzione imponibile. prebuilt-tax.us.w2
Imposta statunitense 1040 Estrae i dettagli degli interessi ipotecari. prebuilt-tax.us.1040(varianti)
Imposta statunitense 1098 Estrae i dettagli degli interessi ipotecari. prebuilt-tax.us.1098(varianti)
Imposta USA 1099 Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro. prebuilt-tax.us.1099(varianti)

Documento di esempio W-2 elaborato con Document Intelligence Studio:

Screenshot di un esempio di W-2.

Documenti ipotecari statunitensi

I modelli di documento ipotecario statunitense analizzano ed estraggono i campi chiave, inclusi i mutuatari, i prestiti e le informazioni sulle proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:

Modello Descrizione ModelID
Contratto di licenza con l'utente finale 1003 (EULA) Estrarre prestiti, mutuatari, dettagli di proprietà. prebuilt-mortgage.us.1003
Documento di riepilogo 1008 Estrarre i dettagli del mutuatario, del venditore, della proprietà, del mutuo e della sottoscrizione. prebuilt-mortgage.us.1008
Informativa sulla chiusura Estrarre i dettagli di chiusura, transazioni e prestito. prebuilt-mortgage.us.closingDisclosure
Certificato di matrimonio Estrarre i dettagli relativi al matrimonio per i richiedenti prestiti comuni. prebuilt-marriageCertificate
Imposta statunitense W-2 Estrarre i dettagli del risarcimento fiscale per la verifica del reddito. prebuilt-tax.us.w2

Documento di esempio di informativa sulla chiusura elaborato con Document Intelligence Studio:

Screenshot di una informativa di chiusura di esempio.

Contract

Il modello di contratto analizza ed estrae i campi chiave e gli elementi riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.

Contratto di esempio elaborato con Document Intelligence Studio:

Screenshot dell'estrazione del modello di contratto con Document Intelligence Studio.

Fattura

Il modello di fattura consente di automatizzare l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto, le voci e altri dati chiave. Attualmente, il modello supporta fatture in inglese, spagnolo, tedesco, francese, italiano, portoghese e olandese.

Fattura di esempio elaborata con Document Intelligence Studio:

Screenshot di un esempio di fattura.

Ricevuta

Usare il modello di ricevuta per digitalizzare le ricevute di vendita ed estrarre il nome del commerciante, le date, le voci, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione delle ricevute di hotel a pagina singola.

Ricevuta di esempio elaborata con Document Intelligence Studio:

Screenshot di un esempio di ricevuta.

Documento di identità (ID)

Usare il modello documento di identità (ID) per elaborare le patenti di guida USA (tutti i 50 stati e District of Columbia) e le pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio) al fine di estrarre i campi chiave.

Esempio degli Stati Uniti. Patente di guida elaborata utilizzando Document Intelligence Studio:

Screenshot di una scheda di identificazione di esempio.

Certificato di matrimonio

Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre campi chiave, tra cui le persone, la data e l’area geografica.

Certificato di matrimonio statunitense di esempio elaborata con Document Intelligence Studio:

Screenshot di un certificato di matrimonio di esempio.

Carta di credito

Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.

Carta di credito di esempio elaborata con Document Intelligence Studio:

Screenshot di una carta di credito di esempio.

Modelli personalizzati

I modelli personalizzati possono essere classificati a grandi linee in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.

Diagramma dei tipi di modelli personalizzati e delle modalità di compilazione del modello associate.

I modelli di documenti personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. Riconoscono i campi moduli all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, è necessario solo un esempio del tipo di modulo.

I modelli personalizzati della versione v3.0 e successive supporta il rilevamento delle firme nei modelli personalizzati (modulo) e nelle tabelle tra pagine sia nei modelli di tipo modello che nei modelli neurali. Il rilevamento della firma verifica se è presente una firma, non verifica l'identità della persona che firma il documento. Se il modello restituisce unsigned per il rilevamento delle firme, il modello non ha trovato una firma nel campo definito.

Modello personalizzato di esempio elaborato con Document Intelligence Studio:

Screenshot della finestra analizza-un-documento-personalizzato dello strumento Informazioni sui documenti.

Estrazione personalizzata

Il modello di estrazione personalizzato può essere uno dei due tipi, modello personalizzato o neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello sul set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.

Estrazione personalizzata di esempio elaborata con Document Intelligence Studio:

Screenshot dell'analisi del modello di estrazione personalizzata in Document Intelligence Studio.

Classificatore personalizzato

Il modello di classificazione personalizzato consente di identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA). Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque esempi per classe.

Modelli composti

Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 200 modelli personalizzati sottoposti a training.

Finestra di dialogo Modello composto in Document Intelligence Studio:

Screenshot della finestra di dialogo Componi modello personalizzato di Document Intelligence Studio.

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.

Migrazione della versione

Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo Guida alla migrazione di Informazioni sui documenti v3.1

Modello Descrizione
Analisi dei documenti
Layout Estrarre testo e informazioni sul layout dai documenti.
Predefinita
Fattura Estrarre le informazioni chiave dalle fatture in inglese e spagnolo.
Ricevuta Estrarre le informazioni chiave dalle ricevute in inglese.
Documento di identità Estrarre le informazioni chiave da patenti di guida USA e passaporti internazionali.
Biglietto da visita Estrarre le informazioni chiave dai biglietti da visita in inglese.
Personalizzazione
Personalizzazione Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici.
Modello composto Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello creato dai tipi di modulo.

Layout

L'API Layout consente di analizzare ed estrarre testo, tabelle e intestazioni, segni di selezione e informazioni sulla struttura dai documenti.

Documento di esempio elaborato con lo strumento di etichettatura di esempio:

Screenshot dell'analisi

Fattura

Il modello di fattura consente di analizzare ed estrarre le informazioni chiave dalle fatture di vendita. L'API consente di analizzare le fatture in vari formati e di estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto.

Fattura di esempio elaborata con lo strumento di etichettatura di esempio:

Screenshot di un'analisi della fattura di esempio con lo strumento di etichettatura di esempio.

Ricevuta

  • Il modello di ricevuta consente di analizzare ed estrarre le informazioni chiave dalle ricevute di vendita stampate e scritte a mano.

Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio:

Screenshot di un esempio di ricevuta.

Documento di identità

Il modello di documento di identità consente di analizzare ed estrarre le informazioni chiave dai documenti seguenti:

  • U.S. Patenti di guida USA (tutti i 50 stati e District of Columbia)

  • Pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio). L'API consente di analizzare i documenti e di estrarre

Esempio di patente di guida USA elaborato con lo strumento di etichettatura di esempio:

Screenshot di una scheda di identificazione di esempio.

Carta aziendale

Il modello di biglietto da visita consente di analizzare ed estrarre le informazioni chiave dalle immagini dei biglietti da visita.

Biglietto da visita di esempio elaborato con lo strumento di etichettatura di esempio:

Screenshot di un biglietto da visita di esempio.

Personalizzazione

  • I modelli personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. L'API è un programma di apprendimento automatico sottoposto a training per riconoscere campi modulo all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo ed è possibile eseguire il training del modello con o senza set di dati etichettati.

Elaborazione di modelli personalizzati di esempio con lo strumento di etichettatura di esempio:

Screenshot della finestra analizza-un-documento-personalizzato dello strumento Informazioni sui documenti.

Modello personalizzato composto

Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 100 modelli personalizzati con training.

Finestra di dialogo Modello composto con lo strumento di etichettatura di esempio:

Screenshot della finestra di dialogo Componi modello personalizzato di Document Intelligence Studio.

Estrazione dei dati del modello

Modello Estrazione di testo Rilevamento lingua Segni di selezione Tabelle Paragrafi Ruoli di paragrafo Coppie chiave-valore Campi
Layout
Fattura
Ricevuta
Documento di identità
Biglietto da visita
Modulo personalizzato

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Document Intelligence.

Migrazione della versione

Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo Guida alla migrazione di Informazioni sui documenti v3.1

Passaggi successivi