カスタム音声 API リファレンス - Azure Cognitive Services

この記事では、Azure Cognitive Services スイートのサービスである Custom Voice の REST API エンドポイントを呼び出す方法について説明します。 カスタム音声はテキスト読み上げ機能であり、アプリケーション用に一種のカスタマイズされた合成音声を作成できます。 カスタム音声を使用すると、トレーニング データとして人間の音声サンプルを提供することで、ブランドやキャラクターに対して非常に自然な音声を構築できます。 カスタム音声には、プロフェッショナルとパーソナルの 2 つのシナリオがあります。 各シナリオとそのデータ要件について理解を深めるために、 プロフェッショナル個人の声に関するドキュメントをお読みください。

アクセスの要求

プロフェッショナル音声アクセスと個人音声アクセスの両方が、適格性と使用基準に基づいて 制限 されます。 REST API を使用する前に アクセスを要求 してください。

プロフェッショナルな音声を構築する

次の手順で REST API を呼び出します。

  1. プロフェッショナルな音声のためのプロジェクトをCreateします。
  2. 音声タレントの同意を追加します。
  3. プロフェッショナルな音声トレーニング データセットを追加します。
  4. プロフェッショナルな音声モデルをトレーニングします。
  5. プロフェッショナルな音声モデルをエンドポイントとしてデプロイします。
  6. Speech SDK を使用した合成。 (この API の一部ではありません。 ドキュメントをお読みください。)

個人用音声を作成する

次の手順で REST API を呼び出します。

  1. 個人の声のためのプロジェクトをCreateします。
  2. ユーザーの同意を追加します。
  3. 個人の音声をCreateし、話者プロファイル ID を取得します。
  4. Speech SDK を使用した合成。 (この API の一部ではありません。 ドキュメントをお読みください。)

サンプル

Custom Voice API サンプル コード

こちらもご覧ください