Modello di certificati di matrimonio di Informazioni sui documenti

Questo contenuto si applica a: segno di spunta v4.0 (anteprima) segno di spunta

Il modello di certificati di matrimonio di Informazioni sui documenti usa funzionalità efficaci di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave da Informazioni sui certificati. I certificati di matrimonio possono essere di vari formati e qualità, tra cui immagini acquisite tramite telefono, documenti digitalizzati e PDF digitali. L'API analizza il testo del documento, estrae le informazioni chiave, come il nome della sposa, la data di emissione e il luogo del matrimonio e restituisce una rappresentazione di dati JSON strutturati. Il modello al momento supporta i formati di documenti in lingua inglese.

Elaborazione automatizzata dei certificati di matrimonio

L'elaborazione automatizzata dei certificati di matrimonio consiste nell'estrazione dei campi chiave dai certificati di matrimonio. Il processo di analisi dei certificati di matrimonio è sempre stato manuale, quindi dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture in genere rappresenta il primo passaggio da eseguire, nonché il più critico, nell'ambito del processo di automazione dei certificati di matrimonio.

Opzioni di sviluppo

Informazioni sui documenti v4.0 (2024-07-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
prebuilt-marriageCertificate.us Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-marriageCertificate.us

Requisiti di input

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lettura
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1 GB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1 GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono 2 GB con un massimo di 10.000 pagine.

Prova l'estrazione dei dati dei documenti dei certificati di matrimonio

Per scoprire come funziona l'estrazione per il servizio scheda certificato di matrimonio, sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Document Intelligence Studio

  1. Nella home page di Document Intelligence Studio, selezionare Certificato di matrimonio.

  2. È possibile analizzare i certificati di matrimonio di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni di analisi:

    Screenshot del pulsanti Esegui analisi e delle opzioni di analisi in Document Intelligence Studio.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto del linguaggio del modello predefinito.

Estrazione di campi

  • Per i campi di estrazione dei documenti supportati, vedere la pagina relativa allo schema del modello di certificato di matrimonio nel repository di esempio GitHub.

  • Le coppie chiave-valore e le voci del certificato di matrimonio e le voci estratte si trovano nella sezione documentResults dell'output JSON.

Passaggi successivi