什麼是 Speech Studio?

Speech Studio 是一組 UI 型工具,可在您的應用程式中建置及整合 Azure AI 語音服務的功能。 您可以透過無程式碼方法在 Speech Studio 中建立專案,然後使用 Speech SDKSpeech CLI 或 REST API 參考您在應用程式中的資產。

提示

您也可以在 AI Studio 中嘗試語音轉換文字和文字轉換語音,而不需要註冊或撰寫任何程式碼。

Speech Studio 案例

探索、試用及檢視一些常見使用案例的範例程式碼。

  • 字幕:選擇範例影片剪輯以查看即時或離線處理的字幕結果。 了解如何同步處理字幕與輸入音訊、套用粗話篩選、取得部分結果、套用自訂項目,以及識別多語情節的口語語言。 如需詳細資訊,請參閱字幕快速入門

  • 客服中心:檢視示範,了解如何使用語言和語音服務來分析客服中心交談。 即時轉譯通話或批次處理通話、修訂個人識別資訊,以及擷取情感等深入解析,協助您的客服中心使用案例。 如需詳細資訊,請參閱客服中心快速入門

如需在 Speech Studio 中這些案例的示範,請檢視此簡介影片

Speech Studio 功能

在 Speech Studio 中,下列語音服務功能會以專案類型的形式來提供:

  • 即時語音轉換文字:在不必使用任何程式碼的情況下,將音訊檔案拖曳至此,即可快速測試語音轉換文字。 Speech Studio 是示範工具,目的是讓您了解語音轉換文字對音訊範例的運作情況。 若要探索完整的功能,請參閱什麼是語音轉換文字

  • 批次語音轉換文字:快速測試批次謄寫功能以在儲存體中謄寫大量音訊,並以非同步方式接收結果,若要深入了解批次語音轉換文字,請參閱批次語音轉換文字概觀

  • 自訂語音:建立針對特定詞彙集和說話方式量身打造的語音辨識模型。 相較於基本的語音辨識模型,自訂語音模型因為不得公開存取,所以會是您獨一無二競爭優勢的一環。 若要開始上傳範例音訊以建立自訂語音模型,請參閱上傳定型和測試資料集

  • 發音評估會評估語音發音,並向說話者提供關於說話音訊正確度和流暢度的意見反應。 Speech Studio 提供了沙箱供您快速測試此功能,而不需要程式碼。 若要在應用程式中搭配語音 SDK 來使用此功能,請參閱發音評估一文。

  • 語音翻譯:以低延遲快速測試語音,並將語音翻譯成您選擇的其他語言。 若要探索完整的功能,請參閱什麼是語音翻譯

  • 語音資源庫:建置可自然說話的應用程式和服務。 從廣泛的語言、語音和變體組合中選擇。 使用真情實感的擬人化合成語音,讓您的案例更加生動。

  • 自訂語音:建立文字轉換語音的獨一無二自訂語音。 您可以在 Speech Studio 中提供音訊檔案並建立相符的轉譯,然後在應用程式中使用自訂的語音。 若要透過端點建立和使用自訂語音,請參閱建立和使用您的語音模型

  • 音訊內容建立:文字轉換語音合成的無程式碼方法。 您可以依原樣使用輸出音訊,或做為進一步自訂的起點。 您可以針對各種案例 (例如有聲書、新聞廣播、影片旁白和聊天機器人),建立高度自然的音訊內容。 如需詳細資訊,請參閱音訊內容建立文件。

  • 自訂關鍵字:自訂關鍵字是一個字組或短句,可讓您透過語音來啟動產品。 您可以在 Speech Studio 中建立自訂關鍵字,然後產生二進位檔案,在您的應用程式中搭配 Speech SDK 使用

下一步