Comporre modelli personalizzati v3.0

stile di enfasi

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale) blue-checkmark v3.0 (disponibilità generale) blue-checkmark v2.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Versione più recente: purple-checkmark v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.0 blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v3.0 (disponibilità generale) | Versioni più recenti: purple-checkmark v4.0 (anteprima) purple-checkmark v3.1 | Versione precedente: blue-checkmark v2.1

Questo contenuto si applica a: segno di spunta v2.1 | Versione più recente: blue-checkmark v4.0 (anteprima)

Importante

Il comportamento di composizione del modello cambierà in api-version=2024-07-31-preview e versioni successive. Per altre informazioni, vedere modelli personalizzati composti. Il comportamento seguente si applica solo alla versione 3.1 e alle versioni precedenti

Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo ID modello. È possibile assegnare fino a 200 modelli personalizzati sottoposti a training a un singolo ID modello composto. Quando un documento viene inviato a un modello composto, il servizio esegue un passaggio di classificazione per decidere quale modello personalizzato rappresenta in modo accurato il modulo presentato per l'analisi. I modelli composti sono utili per raggruppare vari modelli sottoposti a training per analizzare tipi di modulo simili. Ad esempio, il modello composto può includere modelli personalizzati sottoposti a training per analizzare gli ordini di acquisto per forniture, attrezzature e mobili. Anziché tentare manualmente di selezionare il modello appropriato, è possibile usare un modello composto per determinare il modello personalizzato appropriato per ogni analisi ed estrazione.

Per altre informazioni, vedere Modelli personalizzati composti.

In questo articolo si apprenderà come creare e usare modelli personalizzati composti per analizzare moduli e documenti.

Prerequisiti

Per iniziare, sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure. È possibile creare una sottoscrizione di Azure gratuita.

  • Un'istanza di Informazioni sui documenti. Dopo aver creato la sottoscrizione di Azure, creare una risorsa di Informazioni sui documenti nel portale di Azure per ottenere la chiave e l'endpoint. Se si dispone di una risorsa di Informazioni sui documenti esistente, passare direttamente alla pagina della risorsa. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

    1. Al termine della distribuzione della risorsa selezionare Vai alla risorsa.

    2. Copiare i valori di Chiavi ed Endpoint dal portale di Azure e incollarli in una posizione comoda, ad esempio Blocco note Microsoft. I valori di chiave ed endpoint sono necessari per connettere l'applicazione all'API Informazioni sui documenti.

Fotogramma che mostra come accedere alla chiave della risorsa e all'URL dell'endpoint.

Suggerimento

Per altre informazioni, vedere Creare una risorsa di Informazioni sui documenti.

  • Un account di archiviazione di Azure. Se non si sa come creare un account di archiviazione di Azure, seguire la guida di avvio rapido di Archiviazione di Azure per il portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

Creare modelli personalizzati

Prima di tutto, è necessario un set di modelli personalizzati da comporre. È possibile usare Studio di Informazioni sui documenti, l'API REST o le librerie client. Attieniti alla procedura seguente:

Assemblare il set di dati di training

La creazione di un modello personalizzato inizia con la definizione del set di dati di training. Sono necessari almeno cinque moduli compilati dello stesso tipo per il set di dati di esempio. Possono essere di diversi tipi di file (JPG, PNG, PDF e TIFF) e contenere sia testo stampato che scritto a mano. I moduli devono seguire i requisiti di input per Informazioni sui documenti.

Suggerimento

Seguire questi suggerimenti per ottimizzare il set di dati per il training:

  • Se possibile, utilizza documenti PDF basati su testo anziché documenti basati su immagini. I PDF sottoposti a scansione vengono gestiti come immagini.
  • Per i moduli compilati, utilizza esempi che abbiano tutti i campi compilati.
  • Usa moduli con valori diversi in ogni campo.
  • Se le immagini del modulo sono di qualità inferiore, utilizza un set di dati più grande (10-15 immagini, ad esempio).

Per suggerimenti su come raccogliere i documenti di training, vedere Creare un set di dati di training.

Caricare il set di dati di training

Dopo aver raccolto un set di documenti di training, è necessario caricare i dati di training in un contenitore di archiviazione BLOB di Azure.

Per usare dati etichettati manualmente, occorre caricare i file .labels.json e .ocr.json corrispondenti ai documenti di training.

Eseguire il training del modello personalizzato

Quando si esegue il training del modello con dati etichettati, il modello usa l'apprendimento supervisionato per estrarre valori di interesse usando i moduli etichettati forniti. I dati etichettati generano modelli dalle prestazioni più elevate e anche compatibili con moduli complessi o che contengono valori senza chiavi.

Informazioni sui documenti usa l'API modello di layout predefinito per riconoscere le dimensioni e le posizioni previste degli elementi di testo stampati e scritti a mano ed estrarre le tabelle. Usa quindi le etichette specificate dall'utente per riconoscere le associazioni chiave-valore e le tabelle nei documenti. Per iniziare a eseguire il training di un nuovo modello, è consigliabile usare cinque moduli dello stesso tipo (stessa struttura) etichettati manualmente e aggiungere quindi altri dati etichettati, se necessario, per migliorare l'accuratezza del modello. Informazioni sui documenti consente il training di un modello per estrarre coppie chiave-valore e tabelle usando funzionalità di apprendimento supervisionato.

Per creare modelli personalizzati, iniziare con la configurazione del progetto:

  1. Nella home page dello Studio selezionare Crea nuovo dalla scheda Modello personalizzato.

  2. Usare il comando ➕ Crea un progetto per avviare la configurazione guidata del nuovo progetto.

  3. Immettere i dettagli del progetto, selezionare la sottoscrizione e la risorsa di Azure e il contenitore di archiviazione BLOB di Azure che contiene i dati.

  4. Esaminare, inviare le impostazioni e creare il progetto.

Automazione che mostra come creare un progetto personalizzato nello Studio di Informazioni sui documenti.

Durante la creazione di modelli personalizzati, potrebbe essere necessario estrarre raccolte di dati dai documenti. Le raccolte vengono mostrate in uno dei due formati seguenti. Uso delle tabelle come modello visivo:

  • Conteggio dinamico o variabile di valori (righe) per un determinato set di campi (colonne)

  • Raccolta specifica di valori per un determinato set di campi (colonne e/o righe)

Vedere Studio di Informazioni sui documenti: etichettatura come tabelle

Creare un modello composto

Nota

L'operazione create compose model è disponibile solo per i modelli personalizzati con training con etichette. Il tentativo di comporre modelli senza etichette genererà un errore.

Con l'operazione create compose model, è possibile assegnare fino a 100 modelli personalizzati con training a un singolo ID modello. Quando si analizzano i documenti con un modello composto, Informazioni sui documenti classifica innanzitutto il modulo inviato, quindi sceglie il modello assegnato più adatto e restituisce i risultati per tale modello. Questa operazione è utile nel caso in cui i moduli in ingresso appartengano a uno dei diversi modelli.

Al termine del processo di training, è possibile iniziare a creare il modello composto. Ecco i passaggi per la creazione e l'utilizzo di modelli composti:

Raccogliere gli ID dei modelli

Quando si esegue il training dei modelli usando lo Studio di Informazioni sui documenti, l'ID modello si trova nel menu dei modelli in un progetto:

Screenshot della finestra di configurazione di un modello in Studio di Informazioni sui documenti.

Comporre i modelli personalizzati

  1. Selezionare un progetto di modelli personalizzati.

  2. Nel progetto selezionare la voce di menu Models.

  3. Nell'elenco risultante dei modelli selezionare i modelli da comporre.

  4. Scegliere il pulsante Componi nell'angolo superiore sinistro.

  5. Nella finestra popup assegnare un nome al modello appena composto e selezionare Componi.

  6. Al termine dell'operazione, il nuovo modello composto verrà visualizzato nell'elenco.

  7. Quando il modello è pronto, usare il comando Test per convalidarlo con i documenti di test e osservare i risultati.

Analizzare i documenti

L'operazione Analizza del modello personalizzato richiede di specificare il valore modelID nella chiamata a Informazioni sui documenti. Specificare l'ID modello composto per il parametro modelID nelle applicazioni.

Screenshot di un ID modello composto nello Studio di Informazioni sui documenti.

Gestire i modelli composti

È possibile gestire i modelli personalizzati nei cicli di vita:

  • Test e convalida di nuovi documenti.
  • Download del modello da usare nelle applicazioni.
  • Eliminazione del modello al termine del ciclo di vita.

Screenshot di un modello composto nello Studio di Informazioni sui documenti.

Ottimo. Sono stati appresi i passaggi per creare modelli personalizzati e composti e usarli nei progetti e nelle applicazioni di Informazioni sui documenti.

Passaggi successivi

Provare uno dei nostri argomenti di avvio rapido di Informazioni sui documenti:

C#

Informazioni sui documenti usa una tecnologia avanzata di apprendimento automatico per rilevare ed estrarre informazioni dalle immagini dei documenti e restituire i dati estratti in un output JSON strutturato. Con Informazioni sui documenti è possibile eseguire il training di modelli personalizzati autonomi o combinare modelli personalizzati per creare modelli composti.

  • Modelli personalizzati. I modelli personalizzati di Informazioni sui documenti consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici.

  • Modelli composti. Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo ID modello che include i tipi di moduli. Quando un documento viene inviato a un modello composto, il servizio esegue un passaggio di classificazione per decidere quale modello personalizzato rappresenta in modo accurato il modulo presentato per l'analisi.

In questo articolo si apprenderà come creare modelli personalizzati e composti di Informazioni sui documenti usando lo strumento di etichettatura campioni di Informazioni sui documenti, le API REST o le librerie client.

Strumento di etichettatura campioni

Provare a estrarre i dati da moduli personalizzati usando lo strumento di etichettatura campioni. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente

  • Un'istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Configurare l'interfaccia utente di Informazioni sui documenti:

  1. Selezionare Usa personalizzato per eseguire il training di un modello con etichette e ottenere coppie chiave-valore.

Screenshot dell'opzione di selezione del modello personalizzato dello strumento

  1. Nella finestra successiva selezionare Nuovo progetto:

Screenshot dell'opzione di selezione del nuovo progetto dello strumento

Creare i modelli

I passaggi per la creazione, il training e l'utilizzo di modelli personalizzati e composti sono i seguenti:

Assemblare il set di dati di training

La creazione di un modello personalizzato inizia con la definizione del set di dati di training. Sono necessari almeno cinque moduli compilati dello stesso tipo per il set di dati di esempio. Possono essere di diversi tipi di file (JPG, PNG, PDF e TIFF) e contenere sia testo stampato che scritto a mano. I moduli devono seguire i requisiti di input per Informazioni sui documenti.

Caricare il set di dati di training

È necessario caricare i dati di training in un contenitore di Archiviazione BLOB di Azure. Se non si sa come creare un account di archiviazione di Azure con un contenitore, vedere laguida di avvio rapido di Archiviazione di Azure per il portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio ed eseguire in un secondo momento l'aggiornamento a un livello a pagamento per la produzione.

Eseguire il training del modello personalizzato

Eseguire il training del modello con set di dati etichettati. I set di dati etichettati si basano sull'API modello di layout predefinito, ma include anche l'input umano aggiuntivo, ad esempio le etichette specifiche e le posizioni dei campi. Iniziare con almeno cinque moduli compilati dello stesso tipo per i dati di training etichettati.

Quando si esegue il training con dati etichettati, il modello usa l'apprendimento supervisionato per estrarre valori di interesse usando i moduli etichettati forniti. I dati etichettati generano modelli dalle prestazioni più elevate e anche compatibili con moduli complessi o che contengono valori senza chiavi.

Informazioni sui documenti usa l'API Layout per riconoscere le dimensioni e le posizioni previste degli elementi di testo stampati e scritti a mano ed estrarre le tabelle. Usa quindi le etichette specificate dall'utente per riconoscere le associazioni chiave-valore e le tabelle nei documenti. Per iniziare a eseguire il training di un nuovo modello, è consigliabile usare cinque moduli dello stesso tipo (stessa struttura) etichettati manualmente e aggiungere quindi altri dati etichettati, se necessario, per migliorare l'accuratezza del modello. Informazioni sui documenti consente il training di un modello per estrarre coppie chiave-valore e tabelle usando funzionalità di apprendimento supervisionato.

Introduzione al training con le etichette

[!VIDEO https://video2.skills-academy.com/Shows/Docs-Azure/Azure-Form-Recognizer/player]

Creare un modello composto

Nota

L'operazione Model Compose è disponibile solo per i modelli personalizzati con training con etichette. Il tentativo di comporre modelli senza etichette genererà un errore.

Con l'operazione Model Compose, è possibile assegnare fino a 200 modelli personalizzati con training a un singolo ID modello. Quando si esegue l'analisi con l'ID del modello composto, Informazioni sui documenti prima classifica il modulo inviato, poi sceglie il modello assegnato con la corrispondenza migliore, quindi restituisce i risultati per tale modello. Questa operazione è utile nel caso in cui i moduli in ingresso appartengano a uno dei diversi modelli.

Usando lo strumento di etichettatura campioni di Informazioni sui documenti, l'API REST o le librerie client, seguire la procedura per configurare un modello composto:

  1. Raccogliere gli ID dei modelli personalizzati
  2. Comporre i modelli personalizzati

Raccogliere gli ID dei modelli personalizzati

Al termine del processo di training, al modello personalizzato verrà assegnato un ID modello. È possibile recuperare un ID modello come indicato di seguito:

Quando si esegue il training dei modelli usando lo strumento di etichettatura campioni di Informazioni sui documenti, l'ID modello si trova nella finestra del risultato del training:

Screenshot della finestra dei risultati del training.

Comporre i modelli personalizzati

Dopo aver raccolto i modelli personalizzati corrispondenti a un singolo tipo di modulo, è possibile comporli in un singolo modello.

Lo strumento di etichettatura campioni consente di iniziare rapidamente il training dei modelli e di comporli in un singolo ID modello.

Al termine del training, comporre i modelli nel modo seguente:

  1. Nel menu a sinistra selezionare l'icona di composizione modelli (freccia biforcata).

  2. Nella finestra principale selezionare i modelli da assegnare a un singolo ID modello. I modelli contrassegnati con l'icona della freccia sono già composti.

  3. Scegliere il pulsante Componi nell'angolo superiore sinistro.

  4. Nella finestra popup assegnare un nome al modello appena composto e selezionare Componi.

Al termine dell'operazione, il nuovo modello composto verrà visualizzato nell'elenco.

Screenshot della finestra di composizione del modello.

Analizzare i documenti con il modello personalizzato o composto

L'operazione Analizza del modulo personalizzato richiede di specificare il valore modelID nella chiamata a Informazioni sui documenti. È possibile specificare un singolo ID modello personalizzato o un ID modello composto per il parametro modelID.

  1. Nel menu del riquadro sinistro dello strumento selezionare l'icona Analyze (lampadina).

  2. Scegliere un URL di file o immagine locale da analizzare.

  3. Selezionare il pulsante Esegui analisi.

  4. Lo strumento applica i tag nei riquadri di selezione e segnala la percentuale di attendibilità di ognuno.

Screenshot della finestra analizza-un-documento-personalizzato dello strumento Informazioni sui documenti.

Testare i modelli appena sottoposti a training mediante l'analisi dei moduli che non fanno parte del set di dati di training. A seconda dell'accuratezza indicata, è possibile scegliere di eseguire ulteriori processi di training per migliorare il modello. È possibile continuare il training per migliorare i risultati.

Gestire i modelli personalizzati

È possibile gestire i modelli personalizzati durante tutto il ciclo di vita visualizzando un elenco di tutti i modelli personalizzati nella sottoscrizione, recuperando informazioni su un modello personalizzato specifico ed eliminando modelli personalizzati dall'account.

Ottimo. Sono stati appresi i passaggi per creare modelli personalizzati e composti e usarli nei progetti e nelle applicazioni di Informazioni sui documenti.

Passaggi successivi

Per altre informazioni sulla libreria client di Informazioni sui documenti, vedere la documentazione di riferimento sull'API.