Suporte de idioma e região para o LUIS
Importante
O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.
LUIS tem uma variedade de recursos dentro do serviço. Nem todos os recursos estão na mesma paridade de idioma. Verifique se os recursos em que você está interessado têm suporte na cultura do idioma de destino. Um aplicativo LUIS é específico à cultura e não pode ser alterado após a definição.
Aplicativos LUIS multilíngues
Se você precisar de um aplicativo cliente LUIS multilíngues, como um chatbot, terá algumas opções. Se o LUIS der suporte a todos os idiomas, desenvolva um aplicativo LUIS para cada idioma. Cada aplicativo LUIS tem uma ID de aplicativo exclusiva e um log de ponto de extremidade. Se você precisa fornecer reconhecimento de linguagem para um idioma ao qual o LUIS não oferece suporte, use o serviço Tradutor para traduzir o enunciado para um idioma com suporte, envie o enunciado ao ponto de extremidade do LUIS e receba as pontuações resultantes.
Observação
Uma versão mais recente das funcionalidades de Reconhecimento vocal já está disponível como parte da Linguagem de IA do Azure. Para obter mais informações, confira Documentação da Linguagem de IA do Azure. Para ver as funcionalidades de reconhecimento de linguagem que dão suporte a vários idiomas no serviço de linguagem, confira Compreensão da linguagem coloquial.
Idiomas compatíveis
O LUIS compreende declarações nos seguintes idiomas:
Idioma | Locale | Domínio predefinido | Entidade predefinida | Recomendações da lista de frases | **Análise de sentimento e extração de frases-chave |
---|---|---|---|---|---|
Árabe (versão prévia – árabe moderno padrão) | ar-AR |
- | - | - | - |
*Chinês | zh-CN |
✔ | ✔ | ✔ | - |
Holandês | nl-NL |
✔ | - | - | ✔ |
Inglês (Estados Unidos) | en-US |
✔ | ✔ | ✔ | ✔ |
Inglês (Reino Unido) | en-GB |
✔ | ✔ | ✔ | ✔ |
Francês (Canadá) | fr-CA |
- | - | - | ✔ |
Francês (França) | fr-FR |
✔ | ✔ | ✔ | ✔ |
Alemão | de-DE |
✔ | ✔ | ✔ | ✔ |
Gujarati (versão prévia) | gu-IN |
- | - | - | - |
Híndi (versão prévia) | hi-IN |
- | ✔ | - | - |
Italiano | it-IT |
✔ | ✔ | ✔ | ✔ |
*Japonês | ja-JP |
✔ | ✔ | ✔ | Somente frase principal |
Coreano | ko-KR |
✔ | - | - | Somente frase principal |
Marathi (versão prévia) | mr-IN |
- | - | - | - |
Português (Brasil) | pt-BR |
✔ | ✔ | ✔ | nem todas as subculturas |
Espanhol (México) | es-MX |
- | ✔ | ✔ | ✔ |
Espanhol (Espanha) | es-ES |
✔ | ✔ | ✔ | ✔ |
Tamil (versão prévia) | ta-IN |
- | - | - | - |
Telugu (versão prévia) | te-IN |
- | - | - | - |
Turco | tr-TR |
✔ | ✔ | - | Sentimento, somente |
O suporte aos idiomas varia para entidades predefinidas e domínios predefinidos.
*Notas de suporte ao chinês
- Na cultura
zh-CN
, o LUIS espera o conjunto de caracteres de chinês simplificado em vez do conjunto de caracteres tradicional. - Os nomes de intenções, entidades, recursos e expressões regulares podem estar em caracteres chineses ou romanos.
- Veja a Referência a domínios predefinida para obter informações sobre quais domínios predefinidos são compatíveis com a cultura
zh-CN
.
*Notas de suporte ao japonês
- Como o LUIS não fornece análise sintática e não compreenderá a diferença entre Keigo e japonês informal, será necessário incorporar os diferentes níveis de formalidade como exemplos de treinamento para os seus aplicativos.
- でございます não é o mesmo que です.
- です não é o mesmo que だ.
**Notas de suporte do serviço de linguagem
O serviço de linguagem inclui a análise de sentimento e a entidade predefinida keyPhrase. Só há suporte para subculturas em português: pt-PT
e pt-BR
. Todas as outras culturas têm suporte no nível de cultura principal.
Idiomas com suporte da API de Fala
Veja Idiomas com suporte de Fala para idiomas no modo de ditado de Fala.
Idiomas com suporte para Verificação Ortográfica do Bing
Veja idiomas com suporte da Verificação Ortográfica do Bing para obter uma lista dos idiomas com suporte e status.
Palavras raras ou estrangeiras em um aplicativo
Na culturaen-us
, o LUIS aprende a distinguir mais palavras em inglês, incluindo gírias. Na cultura zh-cn
, o LUIS aprende distinguir a maioria dos caracteres chineses. Se você usar uma palavra rara em en-us
ou caractere em zh-cn
, e você verá que o LUIS não parece capaz de distinguir essa palavra ou caractere, você pode adicionar essa palavra ou caractere a um recurso de lista de frases. Por exemplo, as palavras fora da cultura do aplicativo, ou seja, as palavras estrangeiras, devem ser adicionadas a um recurso de lista de frases.
Idiomas híbridos
Os idiomas híbridos combinam palavras de duas culturas, como inglês e chinês. Não há suporte para esses idiomas no LUIS, pois um aplicativo tem base em uma única cultura.
Geração de tokens
Para executar o aprendizado de máquina, o LUIS divide uma declaração em tokens com base na cultura.
Idioma | cada espaço ou caractere especial | nível do caractere | palavras compostas |
---|---|---|---|
Árabe | ✔ | ||
Chinês | ✔ | ||
Holandês | ✔ | ✔ | |
Inglês (en-us) | ✔ | ||
Inglês (en-GB) | ✔ | ||
Francês (fr-FR) | ✔ | ||
Francês (fr-CA) | ✔ | ||
Alemão | ✔ | ✔ | |
Guzerate | ✔ | ||
Híndi | ✔ | ||
Italiano | ✔ | ||
Japonês | ✔ | ||
Coreano | ✔ | ||
Marati | ✔ | ||
Português (Brasil) | ✔ | ||
Espanhol (es-ES) | ✔ | ||
Espanhol (es-MX) | ✔ | ||
Tâmil | ✔ | ||
Télugo | ✔ | ||
Turco | ✔ |
Versões personalizadas do criador de token
As seguintes culturas têm versões de criador de token personalizadas:
Cultura | Versão | Finalidade |
---|---|---|
Alemãode-de |
1.0.0 | Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais. Se um usuário inserir Ich fahre einen krankenwagen como enunciado, ele será convertido em Ich fahre einen kranken wagen . Permitir a marcação de kranken e de wagen independentemente como entidades diferentes. |
Alemãode-de |
1.0.2 | Cria tokens das palavras dividindo-as em espaços. Se o usuário inserir Ich fahre einen krankenwagen como enunciado, ele permanecerá como um único token. Portanto, krankenwagen é marcado como uma única entidade. |
Holandêsnl-nl |
1.0.0 | Cria tokens de palavras por meio de um criador baseado em machine learning, que tenta dividir palavras compostas nos componentes individuais. Se um usuário inserir Ik ga naar de kleuterschool como enunciado, ele será convertido em Ik ga naar de kleuter school . Permitir a marcação de kleuter e de school independentemente como entidades diferentes. |
Holandêsnl-nl |
1.0.1 | Cria tokens das palavras dividindo-as em espaços. Se o usuário inserir Ik ga naar de kleuterschool como enunciado, ele permanecerá como um único token. Portanto, kleuterschool é marcado como uma única entidade. |
Migração entre as versões de gerador de token
A geração de tokens ocorre no nível do aplicativo. Não há suporte para geração de tokens no nível de versão.
Importe o arquivo como um novo aplicativo, em vez de uma versão. Essa ação significa que o novo aplicativo tem uma ID diferente, mas usa a versão do criador de token especificada no arquivo.