Типы служб API речи

Вы можете использовать службу распознавания речи ИИ Azure для преобразования речи, включая распознавание речи в текст, преобразование речи и распознавание говорящего.

Примечание.

Используйте Azure Cognitive Service для языка , если вы хотите собрать аналитические сведения о терминах или фразах или получить подробный контекстный анализ речевых или письменных языков.

Службы

  • Речь в текст может преобразовывать звуковые потоки в текст в режиме реального времени или в пакете.
  • Преобразование текста в речь позволяет приложениям преобразовывать текст в человеческую речь.
  • Перевод речи обеспечивает многоязычное преобразование речи в речь и преобразование речи в текст аудиопотоков.

Выбор службы распознавания речи

Эта блок-диаграмма поможет выбрать службу распознавания речи, которая соответствует вашим потребностям:

Схема, показывающая, как выбрать службу распознавания речи.

Левая часть схемы иллюстрирует процессы аудио- и аудио-текста.

  • Речь в тексте используется для преобразования речи из источника звука в текстовый формат.
  • Речь в речь используется для перевода речи на один язык на другой язык.

В правой части схемы показаны процессы преобразования текста в звук.

  • Текст в речь используется для создания голосового звука из источника текста.

Распространенные варианты использования

В следующей таблице рекомендуется использовать службы для некоторых распространенных вариантов использования.

Вариант использования Служба для использования
Предоставление закрытых подписей для записанных или живых видео Преобразование речи в текст
Создание расшифровки телефонного звонка или собрания Преобразование речи в текст
Реализация автоматического диктовки заметок Преобразование речи в текст
Определение предполагаемого пользовательского ввода для дальнейшей обработки Преобразование речи в текст
Создание голосовых ответов на входные данные пользователя Преобразование текста в речь
Создание голосовых меню для телефонных систем Преобразование текста в речь
Чтение сообщений электронной почты или текстовых сообщений вслух в сценариях без рук Преобразование текста в речь
Широковещательные объявления в общественных местах, таких как железнодорожные станции или аэропорты Преобразование текста в речь
Создание субтитров в режиме реального времени для речи или одновременного двустороннего перевода беседы Преобразование речи в текст

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.

Основные авторы:

Другие участники:

Чтобы просмотреть неопубликованные профили LinkedIn, войдите в LinkedIn.

Следующие шаги