カスタム音声 API リファレンス - Azure Cognitive Services

[アーティクル]
05/01/2024

この記事では、Azure Cognitive Services スイートのサービスである Custom Voice の REST API エンドポイントを呼び出す方法について説明します。カスタム音声はテキスト読み上げ機能であり、アプリケーション用に一種のカスタマイズされた合成音声を作成できます。カスタム音声を使用すると、トレーニングデータとして人間の音声サンプルを提供することで、ブランドやキャラクターに対して非常に自然な音声を構築できます。カスタム音声には、プロフェッショナルとパーソナルの 2 つのシナリオがあります。各シナリオとそのデータ要件について理解を深めるために、プロフェッショナルと個人の声に関するドキュメントをお読みください。

アクセスの要求

プロフェッショナル音声アクセスと個人音声アクセスの両方が、適格性と使用基準に基づいて制限されます。 REST API を使用する前にアクセスを要求してください。

プロフェッショナルな音声を構築する

次の手順で REST API を呼び出します。

プロフェッショナルな音声のためのプロジェクトをCreateします。
音声タレントの同意を追加します。
プロフェッショナルな音声トレーニングデータセットを追加します。
プロフェッショナルな音声モデルをトレーニングします。
プロフェッショナルな音声モデルをエンドポイントとしてデプロイします。
Speech SDK を使用した合成。 (この API の一部ではありません。ドキュメントをお読みください。)

個人用音声を作成する

次の手順で REST API を呼び出します。

個人の声のためのプロジェクトをCreateします。
ユーザーの同意を追加します。
個人の音声をCreateし、話者プロファイル ID を取得します。
Speech SDK を使用した合成。 (この API の一部ではありません。ドキュメントをお読みください。)

サンプル

Custom Voice API サンプルコード

こちらもご覧ください

Custom Voice API swagger
Azure Cognitive Service リソースを作成するには、「 Azure Cognitive Service の概要」を参照してください。

次の方法で共有