Che cos’è il riconoscimento di entità denominate personalizzato?

Il riconoscimento entità denominata personalizzato del testo è una delle funzionalità personalizzate offerte da Lingua di Azure AI. È un servizio API basato sul cloud che applica l'intelligenza di Machine Learning per consentire la generazione di modelli personalizzati per attività di riconoscimento di entità denominate personalizzato.

Il riconoscimento di entità denominate (NER) personalizzato consente agli utenti di generare modelli di intelligenza artificiale personalizzati per estrarre entità specifiche del dominio da testo non strutturato, ad esempio contratti o documenti finanziari. Creando un progetto di riconoscimento di entità denominate (NER) personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare un modello e migliorarne le prestazioni prima di renderlo disponibile all'uso. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in questa guida di avvio rapido.

Questa documentazione contiene i tipi di articoli seguenti:

  • Gli avvii rapidi, ovvero istruzioni introduttive su come eseguire richieste al servizio.
  • I concetti forniscono spiegazioni delle funzionalità e delle caratteristiche del servizio.
  • Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Esempi di scenari d'uso

Il riconoscimento di entità denominate personalizzato può essere usato in più scenari in diversi settori:

Estrazione di informazioni

Molte organizzazioni finanziarie e legali estraggono e normalizzano quotidianamente i dati da migliaia di origini di testo complesse e non strutturate. Tali origini includono rendiconti bancari, contratti legali o moduli bancari. Ad esempio, l'estrazione dei dati da un'applicazione ipotecaria eseguita manualmente da revisori umani può richiedere diversi giorni. L'automazione di questi passaggi con la generazione di un modello di riconoscimento di entità denominate (NER) personalizzato semplifica il processo e consente di risparmiare costi, tempo e lavoro.

La ricerca è fondamentale per qualunque app che espone contenuto di testo agli utenti. Scenari comuni includono la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il knowledge mining per il data science dei dati. Molte aziende in vari settori desiderano creare un'esperienza di ricerca avanzata per contenuti privati ed eterogenei che include documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare il riconoscimento di entità denominate (NER) personalizzato per estrarre entità dal testo pertinente al proprio settore. Tali entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Controllo e conformità

Invece di esaminare manualmente file di testo molto lunghi per il controllo e l’applicazione di criteri, i reparti IT nelle aziende finanziarie o legali possono usare il riconoscimento di entità denominate (NER) personalizzato per generare soluzioni automatizzate. Queste soluzioni possono essere utili per l’applicazione di criteri di conformità e la configurazione delle regole business necessarie in base alle pipeline di knowledge mining che elaborano contenuti strutturati e non strutturati.

Ciclo di vita di sviluppo di un progetto

L'uso del riconoscimento di entità denominate (NER) personalizzato generalmente implica diversi passaggi.

Ciclo di vita dello sviluppo

  1. Definire uno schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.

  2. Etichettare i dati: l'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. Etichettare con precisione, in modo coerente ed esauriente.

    1. Etichettare con precisione: etichettare sempre ogni entità sul tipo corretto. Includere solo gli elementi da estrarre, evitando dati non necessari nelle etichette.
    2. Etichettare con coerenza: la stessa entità deve avere la stessa etichetta in tutti i file.
    3. Etichetta in maniera completa: etichettare tutte le istanze dell'entità in tutti i file.
  3. Eseguire il training del modello: il modello inizia a imparare dai dati etichettati.

  4. Visualizzare le prestazioni del modello: al termine del training, visualizzare i dettagli di valutazione del modello, le relative prestazioni e indicazioni su come migliorarlo.

  5. Distribuire il modello: la distribuzione di un modello lo rende disponibile all’uso tramite l’API di analisi.

  6. Estrarre entità: usare modelli personalizzati per attività di estrazione di entità.

Documentazione di riferimento ed esempi di codice

Quando si usa il riconoscimento entità denominata personalizzato, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure AI:

Lingua / opzione di sviluppo Documentazione di riferimento Esempi
API REST (creazione) Documentazione relativa all'API REST
API REST (runtime) Documentazione relativa all'API REST
C# (runtime) Documentazione di C# Esempi di C#
Java (Runtime) Documentazione di Java Esempi di Java
JavaScript (runtime) Documentazione di JavaScript Esempi JavaScript
Python (runtime) Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia ma anche le persone che la useranno, le persone interessate e l'ambiente di distribuzione. Per informazioni sull’intelligenza artificiale responsabile e la distribuzione nei propri sistemi, leggere la nota sulla trasparenza per il riconoscimento di entità denominate (NER) personalizzato. Per altre informazioni, vedere anche gli articoli seguenti:

Passaggi successivi