Suporte de idioma e região para o LUIS

Artigo
09/02/2024

Importante

O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.

LUIS tem uma variedade de recursos dentro do serviço. Nem todos os recursos estão na mesma paridade de idioma. Verifique se os recursos em que você está interessado têm suporte na cultura do idioma de destino. Um aplicativo LUIS é específico à cultura e não pode ser alterado após a definição.

Aplicativos LUIS multilíngues

Se você precisar de um aplicativo cliente LUIS multilíngues, como um chatbot, terá algumas opções. Se o LUIS der suporte a todos os idiomas, desenvolva um aplicativo LUIS para cada idioma. Cada aplicativo LUIS tem uma ID de aplicativo exclusiva e um log de ponto de extremidade. Se você precisa fornecer reconhecimento de linguagem para um idioma ao qual o LUIS não oferece suporte, use o serviço Tradutor para traduzir o enunciado para um idioma com suporte, envie o enunciado ao ponto de extremidade do LUIS e receba as pontuações resultantes.

Observação

Uma versão mais recente das funcionalidades de Reconhecimento vocal já está disponível como parte da Linguagem de IA do Azure. Para obter mais informações, confira Documentação da Linguagem de IA do Azure. Para ver as funcionalidades de reconhecimento de linguagem que dão suporte a vários idiomas no serviço de linguagem, confira Compreensão da linguagem coloquial.

Idiomas compatíveis

O LUIS compreende declarações nos seguintes idiomas:

Idioma	Locale	Domínio predefinido	Entidade predefinida	Recomendações da lista de frases	**Análise de sentimento e extração de frases-chave
Árabe (versão prévia – árabe moderno padrão)	`ar-AR`	-	-	-	-
*Chinês	`zh-CN`	✔	✔	✔	-
Holandês	`nl-NL`	✔	-	-	✔
Inglês (Estados Unidos)	`en-US`	✔	✔	✔	✔
Inglês (Reino Unido)	`en-GB`	✔	✔	✔	✔
Francês (Canadá)	`fr-CA`	-	-	-	✔
Francês (França)	`fr-FR`	✔	✔	✔	✔
Alemão	`de-DE`	✔	✔	✔	✔
Gujarati (versão prévia)	`gu-IN`	-	-	-	-
Híndi (versão prévia)	`hi-IN`	-	✔	-	-
Italiano	`it-IT`	✔	✔	✔	✔
*Japonês	`ja-JP`	✔	✔	✔	Somente frase principal
Coreano	`ko-KR`	✔	-	-	Somente frase principal
Marathi (versão prévia)	`mr-IN`	-	-	-	-
Português (Brasil)	`pt-BR`	✔	✔	✔	nem todas as subculturas
Espanhol (México)	`es-MX`	-	✔	✔	✔
Espanhol (Espanha)	`es-ES`	✔	✔	✔	✔
Tamil (versão prévia)	`ta-IN`	-	-	-	-
Telugu (versão prévia)	`te-IN`	-	-	-	-
Turco	`tr-TR`	✔	✔	-	Sentimento, somente

O suporte aos idiomas varia para entidades predefinidas e domínios predefinidos.

*Notas de suporte ao chinês

Na cultura zh-CN, o LUIS espera o conjunto de caracteres de chinês simplificado em vez do conjunto de caracteres tradicional.
Os nomes de intenções, entidades, recursos e expressões regulares podem estar em caracteres chineses ou romanos.
Veja a Referência a domínios predefinida para obter informações sobre quais domínios predefinidos são compatíveis com a cultura zh-CN.

*Notas de suporte ao japonês

Como o LUIS não fornece análise sintática e não compreenderá a diferença entre Keigo e japonês informal, será necessário incorporar os diferentes níveis de formalidade como exemplos de treinamento para os seus aplicativos.
- でございます não é o mesmo que です.
- です não é o mesmo que だ.

**Notas de suporte do serviço de linguagem

O serviço de linguagem inclui a análise de sentimento e a entidade predefinida keyPhrase. Só há suporte para subculturas em português: pt-PT e pt-BR. Todas as outras culturas têm suporte no nível de cultura principal.

Idiomas com suporte da API de Fala

Veja Idiomas com suporte de Fala para idiomas no modo de ditado de Fala.

Idiomas com suporte para Verificação Ortográfica do Bing

Veja idiomas com suporte da Verificação Ortográfica do Bing para obter uma lista dos idiomas com suporte e status.

Palavras raras ou estrangeiras em um aplicativo

Na culturaen-us, o LUIS aprende a distinguir mais palavras em inglês, incluindo gírias. Na cultura zh-cn, o LUIS aprende distinguir a maioria dos caracteres chineses. Se você usar uma palavra rara em en-us ou caractere em zh-cn, e você verá que o LUIS não parece capaz de distinguir essa palavra ou caractere, você pode adicionar essa palavra ou caractere a um recurso de lista de frases. Por exemplo, as palavras fora da cultura do aplicativo, ou seja, as palavras estrangeiras, devem ser adicionadas a um recurso de lista de frases.

Idiomas híbridos

Os idiomas híbridos combinam palavras de duas culturas, como inglês e chinês. Não há suporte para esses idiomas no LUIS, pois um aplicativo tem base em uma única cultura.

Geração de tokens

Para executar o aprendizado de máquina, o LUIS divide uma declaração em tokens com base na cultura.

Idioma	cada espaço ou caractere especial	nível do caractere	palavras compostas
Árabe	✔
Chinês		✔
Holandês	✔		✔
Inglês (en-us)	✔
Inglês (en-GB)	✔
Francês (fr-FR)	✔
Francês (fr-CA)	✔
Alemão	✔		✔
Guzerate	✔
Híndi	✔
Italiano	✔
Japonês			✔
Coreano		✔
Marati	✔
Português (Brasil)	✔
Espanhol (es-ES)	✔
Espanhol (es-MX)	✔
Tâmil	✔
Télugo	✔
Turco	✔

Versões personalizadas do criador de token

As seguintes culturas têm versões de criador de token personalizadas:

Cultura	Versão	Finalidade
Alemão `de-de`	1.0.0	Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais. Se um usuário inserir `Ich fahre einen krankenwagen` como enunciado, ele será convertido em `Ich fahre einen kranken wagen`. Permitir a marcação de `kranken` e de `wagen` independentemente como entidades diferentes.
Alemão `de-de`	1.0.2	Cria tokens das palavras dividindo-as em espaços. Se o usuário inserir `Ich fahre einen krankenwagen` como enunciado, ele permanecerá como um único token. Portanto, `krankenwagen` é marcado como uma única entidade.
Holandês `nl-nl`	1.0.0	Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais. Se um usuário inserir `Ik ga naar de kleuterschool` como enunciado, ele será convertido em `Ik ga naar de kleuter school`. Permitir a marcação de `kleuter` e de `school` independentemente como entidades diferentes.
Holandês `nl-nl`	1.0.1	Cria tokens das palavras dividindo-as em espaços. Se o usuário inserir `Ik ga naar de kleuterschool` como enunciado, ele permanecerá como um único token. Portanto, `kleuterschool` é marcado como uma única entidade.

Migração entre as versões de gerador de token

A geração de tokens ocorre no nível do aplicativo. Não há suporte para geração de tokens no nível de versão.

Importe o arquivo como um novo aplicativo, em vez de uma versão. Essa ação significa que o novo aplicativo tem uma ID diferente, mas usa a versão do criador de token especificada no arquivo.

Compartilhar via