Типы служб API речи
Вы можете использовать службу распознавания речи ИИ Azure для преобразования речи, включая распознавание речи в текст, преобразование речи и распознавание говорящего.
Примечание.
Используйте Azure Cognitive Service для языка , если вы хотите собрать аналитические сведения о терминах или фразах или получить подробный контекстный анализ речевых или письменных языков.
Службы
- Речь в текст может преобразовывать звуковые потоки в текст в режиме реального времени или в пакете.
- Преобразование текста в речь позволяет приложениям преобразовывать текст в человеческую речь.
- Перевод речи обеспечивает многоязычное преобразование речи в речь и преобразование речи в текст аудиопотоков.
Выбор службы распознавания речи
Эта блок-диаграмма поможет выбрать службу распознавания речи, которая соответствует вашим потребностям:
Левая часть схемы иллюстрирует процессы аудио- и аудио-текста.
- Речь в тексте используется для преобразования речи из источника звука в текстовый формат.
- Речь в речь используется для перевода речи на один язык на другой язык.
В правой части схемы показаны процессы преобразования текста в звук.
- Текст в речь используется для создания голосового звука из источника текста.
Распространенные варианты использования
В следующей таблице рекомендуется использовать службы для некоторых распространенных вариантов использования.
Вариант использования | Служба для использования |
---|---|
Предоставление закрытых подписей для записанных или живых видео | Преобразование речи в текст |
Создание расшифровки телефонного звонка или собрания | Преобразование речи в текст |
Реализация автоматического диктовки заметок | Преобразование речи в текст |
Определение предполагаемого пользовательского ввода для дальнейшей обработки | Преобразование речи в текст |
Создание голосовых ответов на входные данные пользователя | Преобразование текста в речь |
Создание голосовых меню для телефонных систем | Преобразование текста в речь |
Чтение сообщений электронной почты или текстовых сообщений вслух в сценариях без рук | Преобразование текста в речь |
Широковещательные объявления в общественных местах, таких как железнодорожные станции или аэропорты | Преобразование текста в речь |
Создание субтитров в режиме реального времени для речи или одновременного двустороннего перевода беседы | Преобразование речи в текст |
Соавторы
Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участниками.
Основные авторы:
- Крути Мехта | Старший инженер Быстрого отслеживания Azure
- Оскар Шимабукуро | Старший архитектор облачных решений
Другие участники:
- Мик Альбертс | Технический писатель
- Эшиш Чахуан | Старший архитектор облачных решений
- Брэндон Ковен | Старший архитектор облачных решений
- Манджит Сингх | Программист
- Кристина Скарпатиотаки | Старший архитектор облачных решений
- Натан Widdup | Старший инженер Быстрого отслеживания Azure
Чтобы просмотреть неопубликованные профили LinkedIn, войдите в LinkedIn.
Следующие шаги
- Что такое служба "Речь"?
- Запись блога API службы "Речь"
- Схема обучения. Подготовка и управление Azure Cognitive Services
- Схема обучения. Обработка и перевод речи с помощью Azure Cognitive Speech Services