Modello di ricevuta di Intelligence sui documenti

Importante

  • Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
  • Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
  • La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
    • Stati Uniti orientali
    • Stati Uniti occidentali 2
    • Europa occidentale
    • Stati Uniti centro-settentrionali

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale) blue-checkmark v2.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Versione più recente: purple-checkmark v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.0 blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Versioni più recenti: purple-checkmark v4.0 (anteprima) purple-checkmark v3.1 | Versione precedente: blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v2.1 | Versione più recente: blue-checkmark v4.0 (anteprima)

Il modello di ricevuta di Intelligence sui documenti combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati.

Tipi di ricevute supportati:

  • Carta termica
  • Carta di credito
  • Gas
  • Parcheggio
  • Hotel
  • Trasporto
  • Comunicazione
  • Entertainment
  • Biglietto aereo
  • Formazione
  • Farmacia/Medicale

Estrazione dati delle ricevute

La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie analizzate, fotografate e stampate, in un formato digitale per un’elaborazione downstream semplificata. Alcuni esempi sono: Gestione spese, analisi del comportamento dei consumatori, automazione delle imposte e così via. L’uso di Intelligence sui documenti con la tecnologia di riconoscimento ottico dei caratteri (OCR) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L’elaborazione di Intelligence sui documenti semplifica il processo di conversione ma riduce notevolmente il tempo e il lavoro richiesti, facilitando così recupero e gestione dei dati efficienti.

Ricevuta di esempio elaborata con Document Intelligence Studio:

Screenshot di una ricevuta di esempio elaborata in Document Intelligence Studio.

Ricevuta di esempio elaborata con lo strumento di etichettatura di Intelligence sui documenti:

Screenshot di una ricevuta di esempio elaborata con lo strumento di etichettatura di esempio del modulo.

Opzioni di sviluppo

Informazioni sui documenti v4.0 (2024-07-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
prebuilt-receipt

Intelligence sui documenti v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
prebuilt-receipt

Intelligence sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di ricevuta Document Intelligence Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
prebuilt-receipt

Intelligence sui documenti v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di ricevuta Strumento di etichettatura di Intelligence sui documenti
API REST
SDK Client-library
Contenitore Docker di Intelligence sui documenti

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • Autorizzazione della pagina di supporto per PDF e TIFF: Intelligence sui documenti può elaborare fino a 2.000 pagine per sottoscrittori del livello standard o solo le prime due pagine per i sottoscrittori del livello gratuito.
  • Dimensioni del file supportate: meno di 50 MB; pixel minimi 50 x 50 px; pixel massimi 10.000 x 10.000 px.

Estrazione dei dati del modello di ricevuta

Vedere in che modo Intelligence sui documenti estrae dati, inclusi ora e data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:

  • Sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.

  1. Nella home page di Studio di Informazioni sui documenti selezionare Ricevute.

  2. È possibile analizzare la ricevuta di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le Opzioni di analisi:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Studio di Informazioni sui documenti.

Strumento di etichettatura di esempio di Informazioni sui documenti

  1. Passare allo strumento di esempio di Informazioni sui documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il Tipo di modulo da analizzare nel menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa del percorso di origine.

  6. Nel campo dell'endpoint del servizio Informazioni sui documenti, incollare l'endpoint ottenuto con la sottoscrizione di Informazioni sui documenti.

  7. Nel campo chiave, incollare la chiave ottenuta dalla risorsa di Intelligence sui documenti.

    Screenshot del menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Informazioni sui documenti chiama l'API Analyze Prebuilt e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell’operazione di analisi dei risultati del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del servizio Informazioni sui documenti.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto per i modelli predefiniti.

Estrazione di campi

Nome Tipo Descrizione Output standardizzato
ReceiptType String Tipo di ricevuta di vendita Dettagliata
MerchantName String Nome del commerciante che emette la ricevuta
MerchantPhoneNumber phoneNumber Numero di telefono nell'elenco del commerciante +1 xxx xxx xxxx
MerchantAddress String Indirizzo nell'elenco del commerciante
TransactionDate Data Data di emissione della ricevuta aaaa-mm-gg
TransactionTime Ora Ora di emissione della ricevuta hh-mm-ss (24 ore)
Totali Numero (USD) Totale di transazioni complete della ricevuta Due decimali con virgola mobile
Subtotale Numero (USD) Subtotale della ricevuta, spesso prima dell'applicazione delle imposte Due decimali con virgola mobile
Imposta Numero (USD) Imposta totale sulla ricevuta (spesso IVA o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30. Due decimali con virgola mobile
Suggerimento Numero (USD) Suggerimento incluso dall'acquirente Due decimali con virgola mobile
Articoli Matrice di oggetti Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto
Nome string Descrizione dell'articolo. Rinominato in "Description" nella versione 2022-06-30.
Quantità Numero Quantità di ogni articolo Due decimali con virgola mobile
Price Numero Prezzo singolo di ogni unità articolo Due decimali con virgola mobile
TotalPrice Numero Prezzo totale della voce Due decimali con virgola mobile

Per i campi di estrazione dei documenti supportati, fare riferimento alla pagina dello schema del modello di ricevuta nel repository di esempio GitHub.

Guida alla migrazione e API REST v3.1

Passaggi successivi