リアルタイム文字起こしの生成

重要

この記事で説明されている機能は、現在パブリック プレビュー段階にあります。 このプレビュー バージョンはサービス レベル アグリーメントなしで提供されており、運用環境のワークロードに使用することは推奨されません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

リアルタイム文字起こしは、カスタマー サービスのエクスペリエンスを向上させようとしているあらゆる大規模なビジネスにとって、重要な構成要素です。 Azure Communication Services と Azure AI サービスの統合により、開発者が Call Automation SDK を介してリアルタイム文字起こしを使用できるようになりました。

Azure Communication Services のリアルタイム文字起こしを使うと、Azure AI サービスのリソースを Azure Communication Services と簡単に統合して、通話中に直接文字起こしを生成できます。 これにより、開発者がオーディオ コンテンツを抽出したり、お客様の側でオーディオをテキストに変換するオーバーヘッドに対処したりする必要がなくなります。 この文字起こしの内容を保存して後で使用することにより、通話の履歴を作成したり、通話を要約してエージェントの時間を節約したり、さらにそれをトレーニングや学習のモジュールに提供して、コンタクト センターのエージェントと顧客との対話を向上させたりすることもできます。

Microsoft が所有するデータを使用してトレーニングされ、かつ一般的に使用される音声言語が反映された基本モデルとして、Microsoft はすぐに使用できるユニバーサル言語モデルを活用します。 このモデルは、さまざまな一般的なドメインを表す方言と発音を使用して事前トレーニングされています。 サポートされている言語について詳しくは、「音声サービスの言語と音声のサポート」をご参照ください。

一般的なユース ケース

カスタマー エクスペリエンス向上

エージェントが顧客のニーズをより深く理解し、より迅速かつ正確に対応し、全体的なカスタマー エクスペリエンスを向上させるのに役立ちます。

効率の向上

エージェントがメモを取ることよりも会話に集中できるようになり、対応できる通話の数が増え、生産性が向上します

エージェントのためのコンテキスト

エージェントが電話に出る前に、コンテキストを提供します。これにより、エージェントは発信者が既に提供している情報を把握することができ、発信者がもう一度問題を伝える必要がなくなります。

分析情報を引き出す

通話全体で生成される文字起こしを使えば、他の AI ツールを活用してリアルタイムの分析情報を得ることができ、エージェントやスーパーバイザーが顧客との対話を改善するのに役立ちます。

Call Automation を使ったリアルタイム文字起こしのサンプル フロー

リアルタイム文字起こしのフロー図。

次のステップ