Modello di fattura di Informazioni sui documenti

Importante

  • Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
  • Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
  • La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
    • Stati Uniti orientali
    • Stati Uniti occidentali 2
    • Europa occidentale
    • Stati Uniti centro-settentrionali

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale) blue-checkmark v2.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Versione più recente: purple-checkmark v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.0 blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Versioni più recenti: purple-checkmark v4.0 (anteprima) purple-checkmark v3.1 | Versione precedente: blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v2.1 | Versione più recente: blue-checkmark v4.0 (anteprima)

Il modello di fattura di Informazioni sui documenti usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi e voci chiave da fatture di vendita, bollette e ordini di acquisto. Le fatture possono essere di vari formati e qualità, tra cui immagini acquisite al telefono, documenti digitalizzati e PDF digitali. L'API consente di analizzare il testo delle fatture, estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto, e restituire una rappresentazione dei dati JSON strutturati. Il modello supporta attualmente le fatture in 27 lingue.

Tipi di documenti supportati:

  • Fatture
  • Bollette
  • Ordini cliente
  • Ordini fornitore

Elaborazione automatizzata delle fatture

L'elaborazione automatica delle fatture è il processo di estrazione dei campi chiave accounts payable dai documenti dell'account di fatturazione. I dati estratti includono le voci delle fatture integrate con i flussi di lavoro dei conti fornitori per revisioni e pagamenti. Tradizionalmente, il processo di contabilità fornitori veniva eseguito manualmente ed era di conseguenza molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture è in genere il primo e uno dei passaggi più critici del processo di automazione delle fatture.

Fattura di esempio elaborata con Document Intelligence Studio:

Screenshot di una fattura di esempio analizzata in Document Intelligence Studio.

Fattura di esempio elaborata con lo strumento di etichettatura di Informazioni sui documenti:

Screenshot di una fattura di esempio.

Opzioni di sviluppo

Informazioni sui documenti v4.0 (2024-07-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
API REST
C# SDK
SDK Python
SDK Java
SDK JavaScript
prebuilt-invoice

Informazioni sui documenti v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
API REST
C# SDK
SDK Python
SDK Java
SDK JavaScript
prebuilt-invoice

Informazioni sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di fattura Document Intelligence Studio
API REST
C# SDK
SDK Python
SDK Java
SDK JavaScript
prebuilt-invoice

Informazioni sui documenti v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di fattura Strumento di etichettatura di Informazioni sui documenti
API REST
SDK libreria client
Contenitore Docker di Informazioni sui documenti

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • PDF e TIFF supportati. Vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
  • Le dimensioni del file supportate devono essere inferiori a 50 MB, ma devono essere almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.

Estrazione dei dati del modello di fattura

Vedere in che modo i dati, incluse le informazioni sul cliente, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:

  • Sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

  1. Nella home page di Studio di Informazioni sui documenti selezionare Fatture.

  2. È possibile analizzare la fattura di esempio o caricare file personalizzati.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le Opzioni di analisi:

    Screenshot del pulsanti Esegui analisi e Opzioni di analisi in Document Intelligence Studio.

Strumento di etichettatura di esempio di Informazioni sui documenti

  1. Passare allo strumento di esempio di Informazioni sui documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il Tipo di modulo da analizzare nel menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.

    Screenshot del menu a discesa del percorso di origine.

  6. Nel campo dell'endpoint del servizio Informazioni sui documenti, incollare l'endpoint ottenuto con la sottoscrizione di Informazioni sui documenti.

  7. Nel campo della chiave, incollare la chiave ottenuta dalla risorsa Informazioni sui documenti.

    Screenshot che mostra il menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Informazioni sui documenti chiama l'API Analyze Prebuilt e analizza il documento.

  9. Visualizzare i risultati: vedere le coppie chiave-valore estratte, le voci, il testo evidenziato estratto e le tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del servizio Informazioni sui documenti.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto del linguaggio del modello predefinito.

Estrazione di campi

  • Per i campi di estrazione dei documenti supportati, fare riferimento alla pagina dello schema del modello di fattura nel repository di esempio GitHub.

  • Le coppie chiave-valore e le voci della fattura estratte si trovano nella sezione documentResults dell'output JSON.

Coppie chiave-valore

La fattura predefinita 2022-06-30 e versioni successive supportano l'operazione facoltativa di restituzione delle coppie chiave-valore. Per impostazione predefinita, la restituzione delle coppie chiave-valore è disabilitata. Le coppie chiave-valore sono intervalli specifici all'interno della fattura che identificano un'etichetta o una chiave e la risposta o il valore associato. In una fattura, queste coppie possono essere l'etichetta e il valore immessi dall'utente per tale campo o il numero di telefono. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi, formati e strutture di documenti.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave senza alcun valore associato o quando vengono elaborati campi facoltativi. Ad esempio, il campo del secondo nome può essere lasciato vuoto in un modulo in alcuni casi. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).

Campi estratti

Il servizio Fatture estrae il testo, le tabelle e 26 campi della fattura. Di seguito sono riportati i campi estratti da una fattura nella risposta di output JSON. L'output seguente usa questa fattura di esempio.

Nome Tipo Descrizione Testo Valore (output standardizzato)
CustomerName string Cliente fatturato Microsoft Corp
CustomerId string ID di riferimento per il cliente CID-12345
PurchaseOrder string Numero di riferimento dell'ordine di acquisto PO-3333
InvoiceId string ID per la fattura specifica (spesso "Numero fattura") INV-100
DataFattura data Data di emissione della fattura 15/11/2019 2019-11-15
DueDate data Data di scadenza del pagamento della fattura 15/12/2019 2019-12-15
VendorName string Fornitore che ha creato la fattura CONTOSO
VendorAddress string Indirizzo postale per il fornitore 123 456th St New York, NY, 10001
VendorAddressRecipient string Nome associato a VendorAddress Contoso Headquarters
CustomerAddress string Indirizzo postale per il cliente 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient string Nome associato a CustomerAddress Microsoft Corp
BillingAddress string Indirizzo di fatturazione esplicito per il cliente 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient string Nome associato a BillingAddress Microsoft Services
ShippingAddress string Indirizzo di spedizione esplicito per il cliente 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient string Nome associato a ShippingAddress Microsoft Delivery
Sub​Totale Numero Campo del subtotale identificato nella fattura $ 100,00 100
TotalTax Numero Campo del totale imposte identificato nella fattura $10,00 10
InvoiceTotal Numero Totale nuovi addebiti associati alla fattura $110.00 110
AmountDue Numero Importo totale dovuto al fornitore $610.00 610
ServiceAddress string Indirizzo esplicito del servizio o indirizzo della proprietà per il cliente 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient string Nome associato a ServiceAddress Microsoft Services
RemittanceAddress string Indirizzo esplicito di rimessa o pagamento per il cliente 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string Nome associato a RemittanceAddress Contoso Billing
ServiceStartDate data Prima data per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) 10/14/2019 2019-10-14
ServiceEndDate data Data di fine per il periodo di servizio (ad esempio, un periodo di servizio della bolletta) 11/14/2019 2019-11-14
PreviousUnpaidBalance Numero Saldo esplicito non pagato in precedenza $ 500,00 500

Di seguito sono elencate le voci estratte da una fattura nella risposta di output JSON, che usa questa fattura di esempio:

Nome Tipo Descrizione Testo (voce 1) Valore (output standardizzato)
Articoli string Stringa di testo completa della voce 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00
Periodo Numero L'importo della voce $60.00 100
Descrizione stringa La descrizione di testo per la voce della fattura Servizio di consulenza Servizio di consulenza
Quantità Numero La quantità per la voce della fattura 2 2
UnitPrice Numero Il prezzo netto o lordo (a seconda dell'impostazione nella fattura lorda) di un'unità di questo articolo $30,00 30
ProductCode string Codice prodotto, numero di prodotto o SKU associato alla voce specifica A123
Unità string L'unità della voce, ad esempio kg, lb e così via. ore
Data data Data corrispondente a ogni voce. Spesso è la data in cui è stato spedito l'articolo 3/4/2021 2021-03-04
Imposta Numero Imposta associata a ogni voce. I valori possibili includono l'importo dell'imposta, l'aliquota e se è o meno inclusa 10%

Di seguito sono elencati campi complessi estratti da una fattura nella risposta di output JSON.

TaxDetails

I dettagli fiscali definiscono imposte specifiche applicate al totale della fattura.

Nome Tipo Descrizione Testo (voce 1) Valore (output standardizzato)
Articoli string Stringa di testo completa della voce dell'imposta IVA 15% $60.00
Periodo number Importo della voce dell'imposta 60.00 60
Tariffa string Percentuale della voce dell'imposta 15%

PaymentDetails

Elenca tutte le opzioni di pagamento rilevate nel campo.

Nome Tipo Descrizione Testo (voce 1) Valore (output standardizzato)
IBAN string IBAN GB33BUKB20201555555555
SWIFT string Codice SWIFT BUKBGB22
BankAccountNumber string Numero di conto bancario, un identificatore univoco per un conto bancario 123456
BPayBillerCode string Australian B-Pay Biller Code 12345
BPayReference string Codice di riferimento australiano B-Pay 98765432100

Output JSON

L'output JSON ha tre parti:

  • Il nodo "readResults" contiene tutto il testo e i segni di selezione riconosciuti. Il testo è organizzato in base alla pagina, quindi alla riga, infine in base a singole parole.
  • Il nodo "pageResults" contiene le tabelle e le celle estratte con i rettangoli delimitatori, l'attendibilità e un riferimento alle righe e alle parole nel campo readResults.
  • Il nodo "documentResults" contiene i valori specifici della fattura individuati dal modello. È la posizione in cui trovare tutti i campi della fattura, ad esempio l'ID fattura, l'indirizzo di spedizione, l'indirizzo di fatturazione, il cliente, il totale, le voci e molto altro ancora.

Guida alla migrazione

Passaggi successivi