Modello di biglietto da visita di Informazioni sui documenti
Importante
A partire da Informazioni sui documenti v4.0 (anteprima), il modello di biglietto da visita (prebuilt-businessCard) è deprecato. Per estrarre i dati dai formati di biglietti da visita, usare quanto segue:
Funzionalità | versione | Model ID |
---|---|---|
Modello di biglietto da visita | • v3.1:2023-07-31 (disponibilità generale) • v3.0:2022-08-31 (disponibilità generale) • v2.1 (disponibilità generale) |
prebuilt-businessCard |
Questo contenuto si applica a: v3.0 (disponibilità generale) | Versioni più recenti: v4.0 (anteprima) v3.1 | Versione precedente: v2.1
[! INCLUDE [si applica alla versione 2.1].. /(includes/applies-to-v21.md)]
Il modello di biglietto da visita di Informazioni sui documenti combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dai biglietti da visita. L'API analizza i biglietti da visita stampati, estrae informazioni chiave, ad esempio nome, cognome, nome dell'azienda, indirizzo di posta elettronica e numero di telefono, e restituisce una rappresentazione di dati JSON strutturati.
Estrazione di dati dai biglietti da visita
I biglietti da visita sono un ottimo modo per rappresentare un'azienda o un professionista. Il logo aziendale, i tipi di carattere e le immagini di sfondo disponibili nei biglietti da visita aiutano a promuovere il marchio dell'azienda e a differenziarla dalle altre. L'applicazione di tecniche basate su OCR e apprendimento automatico per automatizzare la digitalizzazione dei biglietti da visita è uno scenario comune di elaborazione delle immagini. I sistemi aziendali usati dai team di vendita e marketing in genere integrano la funzionalità di estrazione dei dati di biglietti da visita a vantaggio degli utenti.
Biglietto da visita di esempio elaborato con Document Intelligence Studio
Esempio di business elaborato con lo Strumento di etichettatura campioni di Informazioni sui documenti
Opzioni di sviluppo
Informazioni sui documenti v3.1:2023-07-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di biglietto da visita | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Informazioni sui documenti v3.0:2022-08-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di biglietto da visita | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Informazioni sui documenti v2.1 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di biglietto da visita | • Strumento di etichettatura di Informazioni sui documenti • API REST • SDK per libreria client • Contenitore Docker di Informazioni sui documenti |
Provare l'estrazione di dati dai biglietti da visita
Vedere in che modo i dati, tra cui nome, posizione, indirizzo, posta elettronica e nome dell'azienda, vengono estratti dai biglietti da visita. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente
Un'istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Document Intelligence Studio
Nota
Document Intelligence Studio è disponibile con le API v3.1 e v3.0.
Nella home page di Document Intelligence Studio selezionare Biglietti da visita.
È possibile analizzare il biglietto da visita di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare Analizza opzioni:
Strumento di etichettatura di esempio di Informazioni sui documenti
Passare allo strumento di esempio di Informazioni sui documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati.
Selezionare il Tipo di modulo da analizzare nel menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL nel menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo dell'endpoint del servizio Informazioni sui documenti, incollare l'endpoint ottenuto con la sottoscrizione di Informazioni sui documenti.
Nel campo chiave, incollare la chiave ottenuta dalla risorsa di Intelligence sui documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Informazioni sui documenti chiama l'API Analyze Prebuilt e analizza il documento.
Visualizzare i risultati: esaminare le coppie chiave-valore estratte, le voci, il testo evidenziato estratto e le tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Questa è una limitazione dello strumento non del servizio Informazioni sui documenti.
Requisiti di input
Formati di file supportati:
Modello PDF Immagine: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Per i formati PDF e TIFF, possono essere elaborate fino a 2.000 pagine (con una sottoscrizione di livello gratuito vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e
4
MB per il livello gratuito (F0).Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e
1
GB per il modello neurale.Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1
GB con un massimo di 10.000 pagine. Per 2024-07-31-preview e le versioni successive, le dimensioni totali dei dati di training sono2
GB con un massimo di 10.000 pagine.
- Formati di file supportati: JPEG, PNG, PDF e TIFF
- Per PDF e TIFF, vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
- Le dimensioni del file devono essere inferiori a 50 MB e le dimensioni devono essere comprese tra almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina di supporto del linguaggio del modello predefinito.
Estrazione dei campi
Per i campi di estrazione dei documenti supportati, vedere la pagina dello schema del modello di biglietto da visita nel repository di esempio gitHub.
Campi estratti
Nome | Tipo | Descrizione | Testo |
---|---|---|---|
ContactNames | matrice di oggetti | Nome del contatto estratto dal biglietto da visita | [{ "FirstName": "John", "LastName": "Doe" }] |
Nome | string | Nome proprio del contatto | "John" |
Cognome | string | Cognome del contatto | "Doe" |
CompanyNames | matrice di stringhe | Nome dell'azienda estratto dal biglietto da visita | ["Contoso"] |
Reparti | matrice di stringhe | Reparto o organizzazione del contatto | ["R&D"] |
JobTitles | matrice di stringhe | Posizione del contatto | ["Software Engineer"] |
Messaggi e-mail | matrice di stringhe | Indirizzo di posta elettronica del contatto estratto dal biglietto da visita | [""johndoe@contoso.com] |
Siti Web | matrice di stringhe | Sito Web estratto dal biglietto da visita | ["https://www.contoso.com"] |
Indirizzi | matrice di stringhe | Indirizzo estratto dal biglietto da visita | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | Matrice di numeri di telefono | Numero di telefono cellulare estratto del biglietto da visita | ["+19876543210"] |
Fax | Matrice di numeri di telefono | Numero di fax estratto del biglietto da visita | ["+19876543211"] |
WorkPhones | Matrice di numeri di telefono | Numero di telefono ufficio estratto del biglietto da visita | ["+19876543231"] |
OtherPhones | Matrice di numeri di telefono | Altro numero di telefono estratto del biglietto da visita | ["+19876543233"] |
Impostazioni locali supportate
I biglietti da visita predefiniti v2.1 supportano le impostazioni locali seguenti:
- en-us
- en-au
- en-ca
- en-gb
- en-in
Guida alla migrazione e API REST v3.1
- Seguire Guida alla migrazione di Informazioni sui documenti v3.1 per informazioni su come usare la versione v3.0 nelle applicazioni e nei flussi di lavoro.
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo Strumento di etichettatura campioni di Informazioni sui documenti
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.