Declarações
Importante
O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.
Enunciados são entradas de usuário que seu aplicativo precisa interpretar. Para treinar o LUIS para extrair intenções e entidades dessas entradas, é importante capturar vários enunciados diferentes de exemplo para cada intenção. O aprendizado ativo, ou o processo contínuo de treinamento em novos enunciados, é essencial para a inteligência de aprendizado de máquina que o LUIS fornece.
Colete enunciados que você acredita que os usuários irão inserir. Inclua enunciados que tenham o mesmo significado, mas são construídos de várias maneiras:
- Duração do enunciado - curta, média e longa para o aplicativo cliente
- Palavra e comprimento de frase
- Posicionamento de palavras - entidade no início, meio e fim do enunciado
- Gramática
- Pluralização
- Lematização
- Escolher substantivo e verbo
- Pontuação – usando gramática correta e incorreta
Escolher enunciados variados
Quando você começa a adicionar enunciados de exemplo ao seu modelo do LUIS, há vários princípios a ter em mente:
Os enunciados nem sempre são bem formados
Seu aplicativo pode precisar processar frases, como “Reservar uma passagem para Paris para mim” ou um fragmento de uma frase, como “Reserva” ou “Voo para Paris”. Os usuários também costumam cometer erros de ortografia. Ao planejar o aplicativo, considere você deseja ou não usar a Verificação Ortográfica do Bing para corrigir a entrada do usuário, antes de passar para o LUIS.
Caso não realize a verificação ortográfica de enunciados do usuário, deverá treinar o LUIS em enunciados que incluam erros de digitação e erros de ortografia.
Usar o idioma representante do usuário
Ao escolher enunciados, esteja ciente de que o que você acha que são termos ou frases comuns pode não ser comum para o usuário típico de sua aplicação cliente. Eles podem não ter experiência de domínio ou usar terminologia diferente. Tenha cuidado ao usar termos ou frases que um usuário só diria se fosse um especialista.
Escolher terminologia e frases variadas
Você descobrirá que, mesmo que você se esforce para criar padrões de frases variados, ainda repetirá algum vocabulário. Por exemplo, os enunciados a seguir têm significado semelhante, mas terminologia e frases diferentes:
- "Como obtenho um computador?"
- "Onde obtenho um computador?"
- "Quero obter um computador, como faço isso?"
- "Quando posso ter um computador?"
O termo principal aqui, computador não varia. Use alternativas como computadores, laptops, estações de trabalho ou até mesmo máquinas. O LUIS, de modo inteligente, pode inferir sinônimos com base no contexto, mas quando você cria enunciados para treinamento, é sempre melhor variá-los.
Enunciados de exemplo em cada intenção
Cada intenção precisa ter exemplos de enunciados, pelo menos 15. Caso tenha uma intenção que não tenha nenhum enunciado de exemplo, não poderá treinar o LUIS. Se você tiver uma intenção com um ou poucos enunciados de exemplo, o LUIS poderá não prever com precisão a intenção.
Adicionar pequenos grupos de enunciados
Sempre que você iterar em seu modelo para aprimora-lo, não adicione grandes quantidades de enunciados. Considere adicionar enunciados em quantidades de 15. Em seguida, Treine, publique e teste novamente.
O LUIS constrói modelos eficazes com enunciados que são cuidadosamente selecionados pelo criador do modelo LUIS. Adicionar muitos enunciados não é positivo porque gera confusão.
É melhor começar com alguns enunciados e, em seguida, examinar os enunciados de ponto de extremidade, para a extração de entidade e previsão de intenção corretas.
Normalização de enunciado
A normalização de enunciados é o processo de ignorar os efeitos dos tipos de texto, como a pontuação e os sinais diacríticos, durante o treinamento e a previsão.
As configurações de normalização de enunciado são desativadas por padrão. Essas configurações incluem:
- Formulários de palavras
- Sinais diacríticos
- Pontuação
Se você ativar uma configuração de normalização, as pontuações do painel de Teste, dos testes em lote e das consultas de ponto de extremidade serão alteradas para todos os enunciados dessa configuração de normalização.
Quando você clona uma versão no portal do LUIS, as configurações de versão são mantidas na nova versão clonada.
De definir as configurações de versão do aplicativo usando o portal do LUIS selecionando Gerenciar no menu de navegação superior, na página Aplicativo Configurações aplicativo. Você também pode usar a API atualizar versão Configurações. Confira a documentação de referência para obter mais informações.
Formulários de palavras
A normalização dos formulários de palavras ignora as diferenças entre palavras que se expandem além da raiz.
Sinais diacríticos
Os sinais diacríticos são marcas ou sinais dentro do texto, como:
İ ı Ş Ğ ş ğ ö ü
Marcas de pontuação
A normalização da pontuação significa que antes de seus modelos serem treinados e de suas consultas do ponto de extremidade serem previstas a pontuação será removida dos enunciados.
Pontuação é um token separado no LUIS. Um enunciado que contém um ponto final é um enunciado separado daquele que não contém um ponto final e pode obter duas previsões diferentes.
Se a pontuação não for normalizada, o LUIS não vai ignorar as marcas de pontuação por padrão, pois alguns aplicativos cliente podem atribuir significado a essas marcas. Certifique-se de incluir enunciados de exemplo que usam pontuação e aqueles que não usam, para que ambos os estilos retornem as mesmas pontuações relativas.
Certifique-se de que o modelo manipule pontuação nos enunciados de exemplo (com e sem pontuação) ou nos padrões, onde é mais fácil ignorar a pontuação. Por exemplo: estou aplicando para a posição {Job} [.]
Se a pontuação não tiver qualquer significado específico no aplicativo cliente, considere a possibilidade de ignorar a pontuação normalizando-a.
Ignorando palavras e pontuação
Se você quiser ignorar palavras específicas ou a pontuação em padrões, use um padrão com a sintaxe ignorar de colchetes, []
.
Treinamento com todos os enunciados
O treinamento não é determinístico: previsão de enunciado pode variar ligeiramente entre versões ou aplicativos. É possível remover o treinamento não determinístico, atualizando a API de configurações de versão com o par de nome/valor UseAllTrainingData para usar todos os dados de treinamento.
Testando enunciados
Os desenvolvedores devem começar a testar o aplicativo LUIS com dados reais, enviando enunciados para a URL do ponto de extremidade de previsão. Esses enunciados são usados para melhorar o desempenho de intenções e entidades com Examinar enunciados. Os testes enviados usando o painel de teste no portal do LUIS não são enviados por meio do ponto de extremidade e não contribuem para o aprendizado ativo.
Examinar enunciados
Depois que seu modelo estiver treinado, publicado e recebendo consultas de ponto de extremidade, examine os enunciados sugeridos pelo LUIS. O LUIS seleciona enunciados de ponto de extremidade que têm pontuações baixas para intenção ou entidade.
Práticas recomendadas
Rótulo para o significado da palavra
Se a escolha ou a disposição das palavras for a mesma, mas não significar a mesma coisa, não a rotule com a entidade.
Nos enunciados a seguir, a palavra fair é um homográfico, o que significa que ela está escrita da mesma forma, mas tem um significado diferente:
- “Que tipos de festivais regionais estão acontecendo na área de Seattle neste verão?”
- "A classificação atual de 2 estrelas para a feira de restaurantes?
Se você quiser que uma entidade de evento localize todos os dados do evento, rotule a palavra fair na primeira declaração, mas não na segunda.
Não ignore possíveis variações de enunciado
O LUIS espera variações nas declarações de uma intenção. As declarações podem variar e ter o mesmo significado geral. As variações podem incluir o comprimento da declaração, a escolha de palavras e o posicionamento de palavras.
Não use o mesmo formato | Use formatos variados |
---|---|
Comprar uma passagem para Seattle | Comprar 1 passagem para Seattle |
Comprar uma passagem para Paris | Reservar dois tíquetes no voo para Paris na próxima segunda-feira |
Comprar uma passagem para Orlando | Eu gostaria de reservar três passagens para Orlando para a semana do saco cheio |
A segunda coluna usa diferentes verbos (comprar reservar, agendar), diferentes quantidades (1, e "duas", 3) e diferentes organizações de palavras, mas todas com a mesma intenção de comprar passagens aéreas para viajar.
Não adicione muitos exemplos de declaração a intenções
Depois que o aplicativo for publicado, adicione apenas enunciados do aprendizado ativo no processo do ciclo de vida de desenvolvimento. Se as declarações forem semelhantes demais, adicione um padrão.