Modello di documento di Informazioni sui documenti

Importante

A partire dalle versioni di Informazioni sui documenti v4.29-02-2024-anteprima, 31-10-2023-anteprima e versioni successive, il modello di documento generale (documento predefinito) è deprecato. Per estrarre coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti, usare i modelli seguenti:

Funzionalità versione Model ID
Modello Layout con il parametro della stringa di query facoltativo features=keyValuePairs abilitato. • v4:29-02-2024-anteprima
• v3.1:31-07-2023 (disponibilità generale)
prebuilt-layout
Modello Documento generale • v3.1:31-07-2023 (disponibilità generale)
• v3.0:31-08-2022 (disponibilità generale)
• v2.1 (disponibilità generale)
prebuilt-document

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Ultima versione: purple-checkmark v4.0 (anteprima) | Versione precedente: blue-checkmark v3.0

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Ultime versioni: purple-checkmark v4.0 (anteprima) segno di spunta viola v3.1

Il modello di documento generale combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per estrarre coppie chiave-valore, tabelle e segni di selezione dai documenti. Il documento generale è disponibile con le API v3.1 e v3.0. Per altre informazioni, vedere la Guida alla migrazione.

Funzionalità del documento generale

  • Il modello di documento generale è un modello già sottoposto a training che non richiede etichette o training.

  • Una singola API estrae coppie chiave/valore, segni di selezione, tabelle e struttura dai documenti.

  • Il modello di documento generale supporta documenti strutturati, semistrutturati e non strutturati.

  • I segni di selezione vengono identificati come campi con un valore :selected: o :unselected:.

Documento di esempio elaborato con Studio di Informazioni sui documenti

Screenshot dell'analisi del documento generale con Studio di Informazioni sui documenti.

Estrazione di coppie chiave-valore

L'API del documento generale supporta la maggior parte dei tipi di modulo e analizza i documenti, quindi estrae le chiavi e i valori associati. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.

Opzioni di sviluppo

Informazioni sui documenti v3. 1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di documento generale Studio di Informazioni sui documenti
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-document

Informazioni sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di documento generale Studio di Informazioni sui documenti
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-document

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

Estrazione dati del modello di documento generale

Provare a estrarre dati da moduli e documenti usando Studio di Informazioni sui documenti.

Sono necessarie le risorse seguenti:

  • Sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Nota

Studio di Informazioni sui documenti e il modello di documento generale sono disponibili con l'API v3.0.

  1. Nella home page di Document Intelligence Studio selezionare Documenti generali.

  2. È possibile analizzare il documento di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare Analizza opzioni:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Studio di Informazioni sui documenti.

Coppie chiave-valore

Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un modulo strutturato, queste coppie possono essere l'etichetta e il valore immessi dall'utente per tale campo. In un documento non strutturato, possono essere la data di esecuzione di un contratto o possono essere basate sul testo di un paragrafo. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi, formati e strutture di documenti.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave senza alcun valore associato o quando vengono elaborati campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcuni casi. Le coppie chiave-valore sono intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).

Estrazione dei dati

Modello Estrazione di testo Coppie chiave-valore Segni di selezione Tabelle Nomi comuni
Documento generale ✓*

✓* - Disponibile solo nelle versioni API 2023-07-31 (versione 3.1 disponibilità generale) e versioni successive.

Lingue e impostazioni locali supportate

Vedere la pagina Lingue supportate - modelli di analisi dei documenti per un elenco completo delle lingue supportate.

Considerazioni

  • Poiché le chiavi sono intervalli di testo estratti dal documento; per i documenti semistrutturati, è necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.

  • È possibile riscontrare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.

Passaggi successivi