Modello di Informazioni sui documenti personalizzato
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
- La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
- Stati Uniti centro-settentrionali
Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti: v3.1 (disponibilità generale) v3.0 (disponibilità generale) v2.1 (disponibilità generale)
Questo contenuto si applica a: v3.1 (disponibilità generale) | Versione più recente: v4.0 (anteprima) | Versioni precedenti: v3.0 v2.1
Questo contenuto si applica a: v3.0 (disponibilità generale) | Versioni più recenti: v4.0 (anteprima) v3.1 | Versione precedente: v2.1
Questo contenuto si applica a: v2.1 | Versione più recente: v4.0 (anteprima)
Il modello personalizzato (in precedenza modulo personalizzato) è un modello di documento facile da sottoporre a training che estrae accuratamente coppie chiave-valore etichettate, segni di selezione, tabelle, aree e firme dai documenti. I modelli usano indicazioni di layout per estrarre valori dai documenti e sono indicati per estrarre campi da documenti altamente strutturati con modelli visivi definiti.
I modelli personalizzati condividono lo stesso formato di etichettatura e la stessa strategia dei modelli neurali personalizzati, con il supporto per più tipi di campo e più lingue.
Funzionalità dei modelli
I modelli personalizzati supportano coppie chiave-valore, segni di selezione, tabelle, campi di firma e aree selezionate.
Campi del modulo | Opzioni di selezione | Campi tabulari (tabelle) | Firma | Aree selezionate | Campi sovrapposti |
---|---|---|---|---|---|
Supportata | Supportato | Supportato | Supportato | Supportato | Non supportato |
Campi tabulari
Con il rilascio delle versioni v3.0 e successive dell'API, nei modelli personalizzati verrà aggiunto il supporto per campi tabulari (tabelle) tra pagine:
- Per etichettare una tabella che si estende su più pagine, etichettare ogni riga tra le diverse pagine di una singola tabella.
- Come procedura consigliata, assicurarsi che il set di dati contenga alcuni esempi delle varianti previste. Ad esempio, includere esempi in cui l'intera tabella si trova in una singola pagina e in cui le tabelle si estendono su due o più pagine se si prevede di visualizzare tali variazioni nei documenti.
I campi tabulari sono utili anche quando si estraggono informazioni ripetute all'interno di un documento non riconosciuto come tabella. Ad esempio, una sezione ripetuta di esperienze lavorative in un curriculum può essere etichettata ed estratta come campo tabulare.
Gestione delle varianti
I modelli su basano su un modello visivo definito, per cui le modifiche al modello comportano una minore accuratezza. In tali casi, dividere il set di dati di training per includere almeno cinque esempio di ogni modello ed eseguire il training di un modello per ogni variante. È quindi possibile comporre i modelli in un singolo endpoint. Per varianti con modifiche impercettibili, ad esempio documenti PDF e immagini digitali, è consigliabile includere almeno cinque esempi di ogni tipo nello stesso set di dati di training.
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview o versione successiva) Documento generale ✔ ✔ Predefinito ✔ ✔ Personalizzazione ✔ ✔ ✱ i file di Microsoft Office non sono attualmente supportati per altri modelli o versioni.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
La dimensione del file per l'analisi dei documenti è di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI
).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
Training a model
I modelli di modello personalizzati sono disponibili a livello generale a partire dall'API v2.0 e versioni successive. Se si inizia con un nuovo progetto o si ha un set di dati etichettato esistente, usare l'API v3.1 o v3.0 con Studio di Informazioni sui documenti per eseguire il training di un modello personalizzato.
Modello | REST API | SDK | Etichettare e testare i modelli |
---|---|---|---|
Modello personalizzato | API v3.1 | SDK di Informazioni sui documenti | Document Intelligence Studio |
Con l'API v3.0 e versioni successive, l'operazione di compilazione per eseguire il training del modello supporta una nuova proprietà buildMode
. Per eseguire il training di un modello personalizzato, impostare buildMode
su template
.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
I modelli personalizzati sono disponibili a livello generale con l'API v3.1. Se si inizia con un nuovo progetto o si ha un set di dati etichettato esistente, usare l'API v3.1 o v3.0 con Studio di Informazioni sui documenti per eseguire il training di un modello personalizzato.
Modello | REST API | SDK | Etichettare e testare i modelli |
---|---|---|---|
Modello personalizzato | API v3.1 | SDK di Informazioni sui documenti | Document Intelligence Studio |
Con l'API v3.0 e versioni successive, l'operazione di compilazione per eseguire il training del modello supporta una nuova proprietà buildMode
. Per eseguire il training di un modello personalizzato, impostare buildMode
su template
.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Lingue e impostazioni locali supportate
Vedere la pagina Lingue supportate - modelli personalizzati per un elenco completo delle lingue supportate.
I modelli (modello) personalizzati sono disponibili a livello generale con l'API v2.1.
Modello | REST API | SDK | Etichettare e testare i modelli |
---|---|---|---|
Modello personalizzato | Informazioni sui documenti 2.1 | SDK di Informazioni sui documenti | Strumento di etichettatura di esempio di Informazioni sui documenti |
Passaggi successivi
Informazioni su come creare e comporre modelli personalizzati: