Migliorare l'accuratezza del riconoscimento vocale con elenchi di frasi

Articolo
09/20/2024

Un elenco di frasi è un elenco di parole o frasi fornite in anticipo per aiutare a migliorarne il riconoscimento. L'aggiunta di una frase a un elenco ne aumenta l'importanza, rendendo così più probabile il riconoscimento.

Gli esempi di frasi includono:

Nomi
Posizioni geografiche
Omonimi
Parole o acronimi univoci per il settore o l'organizzazione

Gli elenchi di frasi sono semplici e contenuti:

Just-in-time: viene fornito un elenco di frasi subito prima di avviare il riconoscimento vocale, eliminando la necessità di eseguire il training di un modello personalizzato.
Contenuti: non è necessario un set di dati di grandi dimensioni. È sufficiente fornire una parola o una frase per aumentarne il riconoscimento.

Per le impostazioni locali degli elenchi di frasi supportate, vedere Lingua e supporto vocale per il servizio Voce.

È possibile usare elenchi di frasi con Speech Studio, l'SDK di Voce o l'interfaccia della riga di comando (CLI) di Voce. L'API di trascrizione batch non supporta gli elenchi di frasi.

È possibile usare elenchi di frasi con il riconoscimento vocale standard e personalizzato. In alcune situazioni, il training di un modello personalizzato che include frasi è probabilmente l'opzione migliore per garantire l'accuratezza. Ad esempio, nei casi seguenti è possibile usare Riconoscimento vocale personalizzato:

Nel caso di elenchi di frasi di grandi dimensioni. Un elenco non deve contenere più di 500 frasi.
Se è necessario un elenco di frasi per le lingue al momento non supportate.

Provare in Speech Studio

È possibile usare Speech Studio per testare il modo in cui l'elenco di frasi consente di migliorare il riconoscimento per il proprio audio. Per implementare un elenco di frasi con l'applicazione in produzione, si usa l'SDK o l'interfaccia della riga di comando di Voce.

Si supponga, ad esempio, che si desideri che il servizio Voce riconosca questa frase: "Ciao Rehaan, sono Jessie della banca Contoso.

Potresti scoprire che una frase è erroneamente riconosciuta come: "Ciao a tutti, sono Jesse della banca can’t do so".

Nello scenario precedente si vuole aggiungere "Rehaan", "Jessie" e "Contoso" all'elenco di frasi. I nomi devono quindi essere riconosciuti correttamente.

Provare ora Speech Studio per vedere in che modo l'elenco di frasi può migliorare l'accuratezza del riconoscimento.

Nota

Potrebbe essere richiesto di selezionare la sottoscrizione di Azure e la risorsa Voce, quindi di confermare la fatturazione per l'area.

Passare a Riconoscimento vocale in tempo reale in Speech Studio.
Per testare il riconoscimento vocale, caricare un file audio o registrare l'audio con un microfono. Ad esempio, selezionare Registra l'audio con un microfono e quindi pronunciare "Ciao Rehaan, sono Jessie della banca Contoso”. Selezionare quindi il pulsante rosso per interrompere la registrazione.
Il risultato della trascrizione verrà visualizzato nella casella di testo Risultati dei test. Se "Rehaan", "Jessie" o "Contoso" sono stati riconosciuti in modo errato, è possibile aggiungere i termini a un elenco di frasi nel passaggio successivo.
Selezionare Mostra opzioni avanzate, quindi attivare Elenco frasi.
Immettere "Contoso;Jessie;Rehaan" nella casella di testo dell'elenco frasi. Più frasi devono essere separate da un punto e virgola.
Usare di nuovo il microfono per testare nuovamente il riconoscimento. In caso contrario, è possibile selezionare la freccia di ripetizione dei tentativi accanto al file audio per eseguire nuovamente l'audio. I termini "Rehaan", "Jessie" o "Contoso" devono essere riconosciuti.