Поддержка языков и регионов в LUIS
Внимание
LUIS будет прекращена 1 октября 2025 г. и с 1 апреля 2023 г. вы не сможете создать новые ресурсы LUIS. Мы рекомендуем перенести приложения LUIS в понимание общения, чтобы воспользоваться продолжением поддержки продуктов и многоязычными возможностями.
Служба LUIS имеет широкий набор функций. Не все компоненты имеют одинаковую языковую функциональную совместимость. Убедитесь, что функции, которые вас интересуют, поддерживаются для используемого языка и региональных параметров. Приложение LUIS учитывает конкретный язык и региональные параметры, которые нельзя изменять после установки.
Многоязыковые приложения LUIS
Если вам требуется многоязыковое клиентское приложение LUIS, например, чат-бот, вам доступно несколько вариантов. Если LUIS поддерживает все языки, можно разработать приложение LUIS для каждого языка. Каждое приложение LUIS получает уникальный идентификатор приложения и журнал конечной точки. Чтобы обеспечить распознавание речи для языка, не поддерживаемого LUIS, можно использовать службу Переводчик для перевода фрагментов речи на поддерживаемый язык, отправки фрагментов в конечную точку LUIS и получения оценок.
Примечание.
Новая версия возможностей Распознавание речи теперь доступна как часть языка ИИ Azure. Дополнительные сведения см . в документации по языку ИИ Azure. Сведения о возможностях распознавания речи, поддерживающих несколько языков в языковой службе, приведены в разделе Распознавание устной речи.
Поддерживаемые языки
Служба LUIS распознает фрагменты речи на следующих языках:
Язык | Locale | Предварительно созданная предметная область | Предварительно созданная сущность | Рекомендации по списку фраз | **Анализ тональности и извлечение ключевых фраз |
---|---|---|---|---|---|
Арабский (предварительная версия — современный стандартный арабский) | ar-AR |
- | - | - | - |
*Китайский | zh-CN |
✔ | ✔ | ✔ | - |
Голландский | nl-NL |
✔ | - | - | ✔ |
Английский (Соединенные Штаты) | en-US |
✔ | ✔ | ✔ | ✔ |
Английский (Соединенное Королевство) | en-GB |
✔ | ✔ | ✔ | ✔ |
Французский (Канада) | fr-CA |
- | - | - | ✔ |
Французский (Франция) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Немецкий | de-DE |
✔ | ✔ | ✔ | ✔ |
Гуджарати (предварительная версия) | gu-IN |
- | - | - | - |
Хинди (предварительная версия) | hi-IN |
- | ✔ | - | - |
Итальянский | it-IT |
✔ | ✔ | ✔ | ✔ |
*Японский | ja-JP |
✔ | ✔ | ✔ | Только ключевая фраза |
Корейский | ko-KR |
✔ | - | - | Только ключевая фраза |
Маратхи (предварительная версия) | mr-IN |
- | - | - | - |
португальский (Бразилия) | pt-BR |
✔ | ✔ | ✔ | не все вложенные языки и региональные параметры |
Испанский (Мексика) | es-MX |
- | ✔ | ✔ | ✔ |
испанский (Испания) | es-ES |
✔ | ✔ | ✔ | ✔ |
Тамильский (предварительная версия) | ta-IN |
- | - | - | - |
Телугу (предварительная версия) | te-IN |
- | - | - | - |
Турецкий | tr-TR |
✔ | ✔ | - | Только тональность |
Языковая поддержка зависит от готовых сущностей и готовых предметных областей.
* Примечания о поддержке китайского языка
- В языке и региональных параметрах
zh-CN
служба LUIS ожидает упрощенную кодировку китайского языка вместо традиционной кодировки. - Имена намерений, сущностей, свойств и регулярных выражений можно указывать китайскими или латинскими символами.
- Сведения о поддерживаемых готовых предметных областях в языке и региональных параметрах
zh-CN
см. в справочнике по готовым предметным областям.
* Примечания о поддержке японского языка
- Поскольку служба LUIS не обеспечивает синтаксический анализ и не может понять разницу между почтительной и неформальной речью, необходимо включить различные уровни формальности в качестве примеров обучения для ваших приложений.
- でございます не равно です.
- です не равно だ.
* * Заметки о поддержке языковой службы
Языковая служба включает в себя предварительно созданную сущность keyPhrase и анализ тональности. Вложенные языки и региональные параметры поддерживаются только для португальского языка: pt-PT
и pt-BR
. Все другие языки и региональные параметры поддерживаются на уровне основного языка.
Поддерживаемые языки API речи
Сведения о языках режима диктовки службы речи см. в разделе Поддерживаемые языки для службы "Речь".
Поддерживаемые языки проверки орфографии Bing
Список поддерживаемых языков и состояний см. в разделе Поддерживаемые языки проверки орфографии Bing.
Редкие или иностранные слова в приложении
В языке и региональных параметрах en-us
служба LUIS обучается для определения большинства английских слов, включая сленг. В языке и региональных параметрах zh-cn
служба LUIS обучается для определения большинства символов китайского языка. Если при использовании редких слов в en-us
или символов в zh-cn
вы понимаете, что служба LUIS не может распознать это слово или символ, их можно добавить в список фраз. Например, слова за пределами языка и региональных параметров приложения, то есть иностранные слова, следует добавить в свойство "Список фраз".
Гибридные языки
Гибридные языки объединяют слова из двух культур, например английского и китайского языка. Эти языки не поддерживаются в LUIS, так как приложение основано на одном языке.
Выделение лексем
В целях машинного обучения LUIS разбивает фрагменты речи на маркеры, в зависимости от языка и региональных параметров.
Язык | каждый пробел и специальный символ | уровень символа | составные слова |
---|---|---|---|
Арабский | ✔ | ||
Китайский | ✔ | ||
Голландский | ✔ | ✔ | |
Английский (en-us) | ✔ | ||
Английский (en-GB) | ✔ | ||
Французский (fr-FR) | ✔ | ||
Французский (fr-CA) | ✔ | ||
Немецкий | ✔ | ✔ | |
Гуджарати | ✔ | ||
Хинди | ✔ | ||
Итальянский | ✔ | ||
Японский | ✔ | ||
Корейский | ✔ | ||
Маратхи | ✔ | ||
португальский (Бразилия) | ✔ | ||
Испанский (es-ES) | ✔ | ||
Испанский (es-MX) | ✔ | ||
Тамильский | ✔ | ||
Телугу | ✔ | ||
Турецкий | ✔ |
Пользовательские версии выделителя лексем
Следующие языки и региональные параметры имеют пользовательские версии выделителя лексем:
Культура | Версия | Характер использования |
---|---|---|
Немецкийde-de |
1.0.0 | Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты. Если пользователь введет Ich fahre einen krankenwagen в качестве речевого фрагмента, то получится Ich fahre einen kranken wagen . Разрешает независимую пометку kranken и wagen как разных сущностей. |
Немецкийde-de |
1.0.2 | Разделяет слова на лексемы, разбивая их пробелами. Если пользователь введет Ich fahre einen krankenwagen в качестве речевого фрагмента, он остается единой лексемой. Таким образом, krankenwagen помечается как единая сущность. |
Голландскийnl-nl |
1.0.0 | Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты. Если пользователь введет Ik ga naar de kleuterschool в качестве речевого фрагмента, то получится Ik ga naar de kleuter school . Разрешает независимую пометку kleuter и school как разных сущностей. |
Голландскийnl-nl |
1.0.1 | Разделяет слова на лексемы, разбивая их пробелами. Если пользователь введет Ik ga naar de kleuterschool в качестве речевого фрагмента, он остается единой лексемой. Таким образом, kleuterschool помечается как единая сущность. |
Миграция между версиями выделителя лексем
Выделение происходит на уровне приложения. Выделение лексем на уровне версии не поддерживается.
Импортируйте файл как новое приложение, а не версию. Это действие означает, что новое приложение имеет другой идентификатор приложения, но использует версию анализатора, указанную в файле.