Che cos'è un assistente vocale?

Tramite gli assistenti vocali con il servizio Voce, gli sviluppatori possono creare interfacce per una conversazione naturale simile a quella umana per applicazioni ed esperienze personalizzate. Il servizio assistente vocale offre un'interazione rapida e affidabile tra un dispositivo e un'implementazione dell'assistente.

Scegliere una soluzione di assistente

Il primo passaggio per la creazione di un assistente vocale consiste nel decidere cosa si vuole che faccia. Il servizio Voce offre più soluzioni complementari per la creazione di interazioni con l'assistente. È possibile che l'applicazione supporti una conversazione aperta con frasi come "Devo andare a Seattle" o "Che tipo di pizza posso ordinare?"

Architettura di riferimento per la creazione di un assistente vocale tramite Speech SDK

Diagramma concettuale del flusso del servizio di orchestrazione dell’assistente vocale.

Funzionalità di base

Sia che si scelga una parola chiave personalizzata o un'altra soluzione per creare le interazioni con gli assistenti, è possibile usare un set completo di funzionalità di personalizzazione per personalizzare l'assistente al marchio, al prodotto e alla personalità.

Categoria Funzionalità
Parola chiave personalizzata Gli utenti possono avviare conversazioni con gli assistenti usando una parola chiave personalizzata, ad esempio "Ehi Contoso". A tale scopo, un'app usa un motore di parole chiave personalizzate in Speech SDK, che è possibile configurare seguendo la procedura in Guida introduttiva: Creare una parola chiave personalizzata. Gli assistenti vocali possono usare la verifica delle parole chiave sul lato del servizio, anziché usando solo il dispositivo, per migliorare l'accuratezza dell'attivazione tramite parola chiave.
Riconoscimento vocale Gli assistenti vocali convertono in tempo reale l'audio in testo usando il riconoscimento vocale dal servizio Voce. Il testo trascritto è disponibile sia per l'implementazione dell'assistente che per l'applicazione client.
Sintesi vocale Le risposte in formato testuale dell'assistente vengono sintetizzate tramite la sintesi vocale del servizio Voce. Il risultato viene quindi reso disponibile per l'applicazione client come flusso audio. Microsoft offre la possibilità di creare una voce personalizzata e di alta qualità tramite sintesi vocale neurale per dare voce a un marchio.

Codice di esempio ed esercitazioni

Il codice di esempio per la creazione di un assistente vocale è disponibile in GitHub in Azure-Samples/Cognitive-Services-Voice-Assistant.

Personalizzazione

Gli assistenti vocali creati tramite il servizio Voce possono usare un'ampia gamma di opzioni di personalizzazione.

Nota

Le opzioni di personalizzazione variano in base alla lingua e alle impostazioni locali. Per altre informazioni, vedere Lingue supportate.