Поддержка языков и регионов в LUIS

Статья
09/01/2024

Внимание

LUIS будет прекращена 1 октября 2025 г. и с 1 апреля 2023 г. вы не сможете создать новые ресурсы LUIS. Мы рекомендуем перенести приложения LUIS в понимание общения, чтобы воспользоваться продолжением поддержки продуктов и многоязычными возможностями.

Служба LUIS имеет широкий набор функций. Не все компоненты имеют одинаковую языковую функциональную совместимость. Убедитесь, что функции, которые вас интересуют, поддерживаются для используемого языка и региональных параметров. Приложение LUIS учитывает конкретный язык и региональные параметры, которые нельзя изменять после установки.

Многоязыковые приложения LUIS

Если вам требуется многоязыковое клиентское приложение LUIS, например, чат-бот, вам доступно несколько вариантов. Если LUIS поддерживает все языки, можно разработать приложение LUIS для каждого языка. Каждое приложение LUIS получает уникальный идентификатор приложения и журнал конечной точки. Чтобы обеспечить распознавание речи для языка, не поддерживаемого LUIS, можно использовать службу Переводчик для перевода фрагментов речи на поддерживаемый язык, отправки фрагментов в конечную точку LUIS и получения оценок.

Примечание.

Новая версия возможностей Распознавание речи теперь доступна как часть языка ИИ Azure. Дополнительные сведения см . в документации по языку ИИ Azure. Сведения о возможностях распознавания речи, поддерживающих несколько языков в языковой службе, приведены в разделе Распознавание устной речи.

Поддерживаемые языки

Служба LUIS распознает фрагменты речи на следующих языках:

Язык	Locale	Предварительно созданная предметная область	Предварительно созданная сущность	Рекомендации по списку фраз	**Анализ тональности и извлечение ключевых фраз
Арабский (предварительная версия — современный стандартный арабский)	`ar-AR`	-	-	-	-
*Китайский	`zh-CN`	✔	✔	✔	-
Голландский	`nl-NL`	✔	-	-	✔
Английский (Соединенные Штаты)	`en-US`	✔	✔	✔	✔
Английский (Соединенное Королевство)	`en-GB`	✔	✔	✔	✔
Французский (Канада)	`fr-CA`	-	-	-	✔
Французский (Франция)	`fr-FR`	✔	✔	✔	✔
Немецкий	`de-DE`	✔	✔	✔	✔
Гуджарати (предварительная версия)	`gu-IN`	-	-	-	-
Хинди (предварительная версия)	`hi-IN`	-	✔	-	-
Итальянский	`it-IT`	✔	✔	✔	✔
*Японский	`ja-JP`	✔	✔	✔	Только ключевая фраза
Корейский	`ko-KR`	✔	-	-	Только ключевая фраза
Маратхи (предварительная версия)	`mr-IN`	-	-	-	-
португальский (Бразилия)	`pt-BR`	✔	✔	✔	не все вложенные языки и региональные параметры
Испанский (Мексика)	`es-MX`	-	✔	✔	✔
испанский (Испания)	`es-ES`	✔	✔	✔	✔
Тамильский (предварительная версия)	`ta-IN`	-	-	-	-
Телугу (предварительная версия)	`te-IN`	-	-	-	-
Турецкий	`tr-TR`	✔	✔	-	Только тональность

Языковая поддержка зависит от готовых сущностей и готовых предметных областей.

* Примечания о поддержке китайского языка

В языке и региональных параметрах zh-CN служба LUIS ожидает упрощенную кодировку китайского языка вместо традиционной кодировки.
Имена намерений, сущностей, свойств и регулярных выражений можно указывать китайскими или латинскими символами.
Сведения о поддерживаемых готовых предметных областях в языке и региональных параметрах zh-CN см. в справочнике по готовым предметным областям.

* Примечания о поддержке японского языка

Поскольку служба LUIS не обеспечивает синтаксический анализ и не может понять разницу между почтительной и неформальной речью, необходимо включить различные уровни формальности в качестве примеров обучения для ваших приложений.
- でございます не равно です.
- です не равно だ.

* * Заметки о поддержке языковой службы

Языковая служба включает в себя предварительно созданную сущность keyPhrase и анализ тональности. Вложенные языки и региональные параметры поддерживаются только для португальского языка: pt-PT и pt-BR. Все другие языки и региональные параметры поддерживаются на уровне основного языка.

Поддерживаемые языки API речи

Сведения о языках режима диктовки службы речи см. в разделе Поддерживаемые языки для службы "Речь".

Поддерживаемые языки проверки орфографии Bing

Список поддерживаемых языков и состояний см. в разделе Поддерживаемые языки проверки орфографии Bing.

Редкие или иностранные слова в приложении

В языке и региональных параметрах en-us служба LUIS обучается для определения большинства английских слов, включая сленг. В языке и региональных параметрах zh-cn служба LUIS обучается для определения большинства символов китайского языка. Если при использовании редких слов в en-us или символов в zh-cn вы понимаете, что служба LUIS не может распознать это слово или символ, их можно добавить в список фраз. Например, слова за пределами языка и региональных параметров приложения, то есть иностранные слова, следует добавить в свойство "Список фраз".

Гибридные языки

Гибридные языки объединяют слова из двух культур, например английского и китайского языка. Эти языки не поддерживаются в LUIS, так как приложение основано на одном языке.

Выделение лексем

В целях машинного обучения LUIS разбивает фрагменты речи на маркеры, в зависимости от языка и региональных параметров.

Язык	каждый пробел и специальный символ	уровень символа	составные слова
Арабский	✔
Китайский		✔
Голландский	✔		✔
Английский (en-us)	✔
Английский (en-GB)	✔
Французский (fr-FR)	✔
Французский (fr-CA)	✔
Немецкий	✔		✔
Гуджарати	✔
Хинди	✔
Итальянский	✔
Японский			✔
Корейский		✔
Маратхи	✔
португальский (Бразилия)	✔
Испанский (es-ES)	✔
Испанский (es-MX)	✔
Тамильский	✔
Телугу	✔
Турецкий	✔

Пользовательские версии выделителя лексем

Следующие языки и региональные параметры имеют пользовательские версии выделителя лексем:

Культура	Версия	Характер использования
Немецкий `de-de`	1.0.0	Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты. Если пользователь введет `Ich fahre einen krankenwagen` в качестве речевого фрагмента, то получится `Ich fahre einen kranken wagen`. Разрешает независимую пометку `kranken` и `wagen` как разных сущностей.
Немецкий `de-de`	1.0.2	Разделяет слова на лексемы, разбивая их пробелами. Если пользователь введет `Ich fahre einen krankenwagen` в качестве речевого фрагмента, он остается единой лексемой. Таким образом, `krankenwagen` помечается как единая сущность.
Голландский `nl-nl`	1.0.0	Разбивает слова на лексемы, разделяя их с помощью выделителя лексем на основе машинного обучения, который пытается разбить составные слова на отдельные компоненты. Если пользователь введет `Ik ga naar de kleuterschool` в качестве речевого фрагмента, то получится `Ik ga naar de kleuter school`. Разрешает независимую пометку `kleuter` и `school` как разных сущностей.
Голландский `nl-nl`	1.0.1	Разделяет слова на лексемы, разбивая их пробелами. Если пользователь введет `Ik ga naar de kleuterschool` в качестве речевого фрагмента, он остается единой лексемой. Таким образом, `kleuterschool` помечается как единая сущность.

Миграция между версиями выделителя лексем

Выделение происходит на уровне приложения. Выделение лексем на уровне версии не поддерживается.

Импортируйте файл как новое приложение, а не версию. Это действие означает, что новое приложение имеет другой идентификатор приложения, но использует версию анализатора, указанную в файле.

Поделиться через