Настройка модели распознавания речи

Примечание.

Настройка модели речи, включая обучение произношения, поддерживается только в пробных учетных записях Индексатора видео Azure и учетных записях Resource Manager. Она не поддерживается в классических учетных записях. Инструкции по обновлению типа учетной записи без затрат см. в учетной записи Индексатора видео Azure AI. Инструкции по использованию пользовательского языка см. в разделе "Настройка языковой модели".

Индексатор видео Azure AI позволяет создавать пользовательские модели распознавания речи для настройки распознавания речи путем отправки наборов данных, используемых для создания модели речи. В этой статье описаны действия, описанные на веб-сайте Индексатора видео. Вы также можете использовать API, как описано в разделе "Настройка модели речи" с помощью API.

Подробные сведения и рекомендации для пользовательских моделей речи см. в статье "Настройка модели распознавания речи с помощью Индексатора видео в Azure AI".

Необходимые компоненты

Создание набора данных

Так как все пользовательские модели должны содержать набор данных, мы начнем с процесса создания наборов данных и управления ими.

  1. Нажмите кнопку настройки модели.
  2. Перейдите на вкладку "Речь" (новая).
  3. Выберите " Отправить набор данных".
  4. Выберите обычный текст или произношение в раскрывающемся меню типа набора данных. Каждая модель речи должна иметь набор данных обычного текста и может при необходимости иметь набор данных произношения.
  5. Выберите "Обзор " и выберите файл набора данных. Можно выбрать только один.
  6. Выберите язык для модели. Выберите язык, который говорится в файлах мультимедиа, которые планируется индексировать с помощью этой модели. Имя набора данных предварительно заполнено именем файла, но его можно изменить.
  7. При необходимости можно добавить описание набора данных. Это может быть полезно для различения каждого набора данных, если ожидается наличие нескольких наборов данных.
  8. Выберите Отправить. После завершения создания набора данных его можно использовать для обучения и создания новых моделей.

Просмотр и обновление набора данных

Набор данных и его свойства можно просмотреть следующими способами:

  • Щелкнув имя набора данных
  • Наведите указатель мыши на набор данных
  • Выбор многоточия

Затем выберите "Просмотреть набор данных".

Затем можно просмотреть имя, описание, язык и состояние набора данных, а также следующие свойства:

Число строк: указывает количество строк, успешно загруженных из общего числа строк в файле. Если весь файл загружен успешно, числа будут совпадать (например, 10 из 10 нормализованных). Если числа не соответствуют (например, 7 из 10 нормализовано), это означает, что только некоторые строки успешно загружены и остальные имели ошибки. Распространенные причины ошибок — это проблемы форматирования строки, например отсутствие интервала между каждым словом в файле произношения. Проверка данных обычного текста и произношения для учебных статей должна быть полезной при поиске проблемы. Чтобы устранить проблему, просмотрите сведения об ошибке, содержащиеся в отчете. Выберите "Просмотреть отчет ", чтобы просмотреть сведения об ошибке относительно строк, которые не загружались успешно (errorKind). Это также можно просмотреть, выбрав вкладку "Отчет ".

Идентификатор набора данных: каждый набор данных имеет уникальный GUID, который необходим при использовании API для операций, ссылающихся на набор данных.

Обычный текст (нормализованный) — содержит нормализованный текст загруженного файла набора данных. Нормализованный текст — это распознанный текст в простой форме без форматирования.

Изменение сведений. Чтобы изменить имя или описание набора данных, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Изменить сведения". Затем вы сможете изменить имя и описание набора данных.

Примечание.

Данные в наборе данных не могут быть изменены или обновлены после отправки набора данных. Если необходимо изменить или обновить данные в наборе данных, скачайте набор данных, выполните изменения, сохраните файл и отправьте новый файл набора данных.

Скачать: чтобы скачать файл набора данных, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Скачать". Кроме того, при просмотре набора данных можно выбрать "Скачать", а затем скачать файл набора данных или отчет отправки в формате JSON.

Удаление. Чтобы удалить набор данных, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Удалить".

Создание пользовательской модели речи

Наборы данных используются в создании и обучении моделей. После создания набора данных обычного текста можно создать и начать работу с пользовательской моделью речи.

Помните следующее при создании и использовании пользовательских моделей речи:

  • Новая модель должна включать по крайней мере один набор данных обычного текста и может иметь несколько наборов данных обычного текста.
  • Необязательно включить набор данных произношения и не более одного.
  • После создания модели нельзя добавлять в него дополнительные наборы данных или вносить изменения в его наборы данных. Если необходимо добавить или изменить наборы данных, создайте новую модель.
  • Если вы индексировали видео с помощью пользовательской модели речи, а затем удалите модель, расшифровка не влияет, если вы не выполняете переиндекс.
  • Если вы удалили набор данных, который использовался для обучения пользовательской модели, так как модель речи уже обучена набором данных, она продолжает использовать ее до удаления модели речи.
  • Если удалить пользовательскую модель, это не влияет на транскрибирование видео, которые уже индексированы с помощью модели.

Обучение модели

Примечание.

После создания модели нельзя добавлять наборы данных. Модель может содержать только наборы данных одного языка.

Существует два способа обучения модели — на вкладке набора данных и на вкладке модели.

Обучение модели с помощью вкладки "Наборы данных"

  1. Просмотрите список наборов данных.
  2. Выберите набор данных обычного текста. Затем можно выбрать значок "Обучение новой модели" выше.
  3. Выберите " Обучение новой модели".
  4. Введите имя модели, языка и при необходимости добавьте описание.
  5. Выберите вкладку "Наборы данных"
  6. Выберите наборы данных, которые нужно включить в модель.
  7. Выберите "Создать и обучить".

Обучение модели с помощью вкладки "Модели"

  1. Перейдите на вкладку Модели.
  2. Щелкните Значок "Обучение новой модели ".
  3. Выберите наборы данных, которые вы хотите быть частью модели.
  4. Введите имя модели, языка и при необходимости добавьте описание.
  5. Откройте вкладку Наборы данных.
  6. Выберите наборы данных, которые нужно включить в модель.
  7. Выберите "Создать и обучить".

Проверка и обновление модели

Просмотр модели. Вы можете просмотреть модель и ее свойства, щелкнув имя модели или при наведении указателя мыши на модель, щелкнув многоточие и выбрав "Модель представления".

Затем вы увидите на вкладке "Сведения" имя, описание, язык и состояние модели, а также следующие свойства:

Идентификатор модели. Каждая модель имеет уникальный GUID, который необходим при использовании API для операций, ссылающихся на модель.

Создано: дата создания модели.

Изменение сведений. Чтобы изменить имя или описание модели, при наведении указателя мыши на модель выберите многоточие и нажмите кнопку "Изменить сведения". Затем вы можете изменить имя и описание модели.

Примечание.

Можно изменить только имя и описание модели. Если вы хотите внести изменения в его наборы данных или добавить наборы данных, необходимо создать новую модель.

Удаление. Чтобы удалить модель, при наведении указателя мыши на набор данных выберите многоточие и нажмите кнопку "Удалить".

Включенные наборы данных: выберите на вкладке "Включенные наборы данных", чтобы просмотреть наборы данных модели.

Использование пользовательской языковой модели при индексировании видео

Пользовательская языковая модель не используется по умолчанию для заданий индексирования, поэтому необходимо выбрать во время процесса отправки индекса.

  1. Во время отправки выберите источник пользовательской языковой модели в раскрывающемся меню языка .
  2. Выберите Отправить.

Те же действия применяются, когда требуется переиндексировать видео с помощью пользовательской модели.