Expressões
Importante
O LUIS será aposentado em 1º de outubro de 2025 e a partir de 1º de abril de 2023 você não poderá criar novos recursos do LUIS. Recomendamos migrar seus aplicativos LUIS para o entendimento de linguagem conversacional para se beneficiar do suporte contínuo ao produto e dos recursos multilíngues.
Os enunciados são entradas de usuários que seu aplicativo precisa interpretar. Para treinar o LUIS para extrair intenções e entidades dessas entradas, é importante capturar vários exemplos diferentes de enunciados para cada intenção. A aprendizagem ativa, ou o processo de continuar a treinar novos enunciados, é essencial para a inteligência de aprendizagem automática que o LUIS proporciona.
Colete expressões que você acha que os usuários entrarão. Inclua enunciados, que significam a mesma coisa, mas são construídos de várias maneiras:
- Comprimento do enunciado - curto, médio e longo para seu aplicativo cliente
- Comprimento da palavra e da frase
- Colocação de palavras - entidade no início, meio e fim do enunciado
- Gramática
- Pluralização
- Travessão
- Escolha do substantivo e do verbo
- Pontuação - usando gramática correta e incorreta
Escolha enunciados variados
Quando você começa a adicionar enunciados de exemplo ao seu modelo LUIS, há vários princípios a ter em mente:
Os enunciados nem sempre são bem formados
Seu aplicativo pode precisar processar frases, como "Reserve uma passagem para Paris para mim" ou um fragmento de uma frase, como "Reserva" ou "Voo para Paris" Os usuários também costumam cometer erros ortográficos. Ao planejar seu aplicativo, considere se deseja ou não usar a Verificação Ortográfica do Bing para corrigir a entrada do usuário antes de passá-la para o LUIS.
Se você não verificar a ortografia dos enunciados do usuário, você deve treinar o LUIS em enunciados que incluam erros de digitação e ortografia.
Utilizar a língua representativa do utilizador
Ao escolher enunciados, esteja ciente de que o que você acha que são termos ou frases comuns podem não ser comuns para o usuário típico do seu aplicativo cliente. Eles podem não ter experiência de domínio ou usar terminologia diferente. Tenha cuidado ao usar termos ou frases que um usuário só diria se fosse um especialista.
Escolha terminologia e fraseado variados
Você descobrirá que, mesmo que se esforce para criar padrões de frases variados, ainda repetirá algum vocabulário. Por exemplo, os seguintes enunciados têm significado semelhante, mas terminologia e fraseado diferentes:
- "Como posso obter um computador?"
- "Onde posso obter um computador?"
- "Quero ter um computador, como posso fazê-lo?"
- "Quando posso ter um computador?"
O termo central aqui, computador, não é variado. Use alternativas como computador de mesa, laptop, estação de trabalho ou até mesmo apenas máquina. O LUIS pode inferir sinónimos de forma inteligente a partir do contexto, mas quando cria enunciados para treino, é sempre melhor variá-los.
Exemplos de enunciados em cada intenção
Cada intenção precisa ter enunciados de exemplo - pelo menos 15. Se você tem uma intenção que não tem nenhum exemplo de enunciado, você não será capaz de treinar LUIS. Se você tiver uma intenção com um ou alguns enunciados de exemplo, o LUIS pode não prever com precisão a intenção.
Adicionar pequenos grupos de expressões
Cada vez que iterar no seu modelo para melhorá-lo, não adicione grandes quantidades de enunciados. Considere adicionar enunciados em quantidades de 15. Em seguida, treine, publique e teste novamente.
O LUIS constrói modelos eficazes com enunciados que são cuidadosamente selecionados pelo autor do modelo LUIS. Adicionar muitos enunciados não é valioso porque introduz confusão.
É melhor começar com alguns enunciados e, em seguida , revisar os enunciados de ponto final para previsão de intenção correta e extração de entidade.
Normalização do enunciado
A normalização do enunciado é o processo de ignorar os efeitos de tipos de texto, como pontuação e diacríticos, durante o treinamento e a previsão.
As configurações de normalização de enunciado são desativadas por padrão. Estas definições incluem:
- Formulários Word
- Diacríticos
- Pontuação
Se você ativar uma configuração de normalização, as pontuações no painel Teste, testes em lote e consultas de ponto de extremidade serão alteradas para todos os enunciados dessa configuração de normalização.
Quando você clona uma versão no portal LUIS, as configurações de versão são mantidas na nova versão clonada.
Defina as configurações de versão do seu aplicativo usando o portal LUIS selecionando Gerenciar no menu de navegação superior, na página Configurações do aplicativo. Você também pode usar a API de configurações de versão de atualização. Consulte a documentação de referência para obter mais informações.
Formulários Word
Normalizar formas de palavras ignora as diferenças nas palavras que se expandem além da raiz.
Diacríticos
Diacríticos são marcas ou sinais dentro do texto, tais como:
İ ı Ş Ğ ş ğ ö ü
Sinais de pontuação
Normalizar a pontuação significa que, antes que seus modelos sejam treinados e antes que suas consultas de ponto final sejam previstas, a pontuação será removida dos enunciados.
A pontuação é um token separado no LUIS. Um enunciado que contém um ponto no final é um enunciado separado de um que não contém um ponto no final, e pode obter duas previsões diferentes.
Se a pontuação não for normalizada, o LUIS não ignorará os sinais de pontuação por padrão, porque alguns aplicativos cliente podem atribuir importância a essas marcas. Certifique-se de incluir expressões de exemplo que usam pontuação e outras que não usam pontuação para que ambos os estilos retornem as mesmas pontuações relativas.
Certifique-se de que o modelo lida com a pontuação nos enunciados de exemplo (tendo e não tendo pontuação) ou em padrões onde é mais fácil ignorar a pontuação. Por exemplo: Estou a candidatar-me à posição {Job}[.]
Se a pontuação não tiver um significado específico em seu aplicativo cliente, considere ignorar a pontuação normalizando a pontuação.
Ignorar palavras e pontuação
Se você quiser ignorar palavras específicas ou pontuação em padrões, use um padrão com a sintaxe ignore de colchetes, []
.
Treino com todos os enunciados
O treinamento não é determinístico: a previsão de emissão pode variar ligeiramente entre versões ou aplicativos. Você pode remover o treinamento não determinístico atualizando a API de configurações de versão com o par nome/valor UseAllTrainingData para usar todos os dados de treinamento.
Testando enunciados
Os desenvolvedores devem começar a testar seu aplicativo LUIS com dados reais enviando expressões para a URL do ponto de extremidade de previsão. Esses enunciados são usados para melhorar o desempenho das intenções e entidades com os enunciados de revisão. Os testes enviados usando o painel de teste no portal LUIS não são enviados através do endpoint e não contribuem para a aprendizagem ativa.
Rever enunciados
Depois que seu modelo for treinado, publicado e receber consultas de ponto final , revise os enunciados sugeridos pelo LUIS. O LUIS seleciona enunciados de ponto final que têm pontuações baixas para a intenção ou entidade.
Melhores práticas
Rótulo para o significado da palavra
Se a escolha da palavra ou o arranjo da palavra for o mesmo, mas não significar a mesma coisa, não a rotule com a entidade.
Nos enunciados a seguir, a palavra justo é um homógrafo, o que significa que está escrito da mesma forma, mas tem um significado diferente:
- "Que tipos de feiras do condado estão acontecendo na área de Seattle neste verão?"
- "A classificação atual de 2 estrelas para a feira de restaurantes?
Se você quiser que uma entidade de evento encontre todos os dados do evento, rotule a palavra fair na primeira declaração, mas não na segunda.
Não ignore possíveis variações de enunciado
LUIS espera variações nos enunciados de uma intenção. Os enunciados podem variar e ter o mesmo significado geral. As variações podem incluir o comprimento do enunciado, a escolha das palavras e o posicionamento das palavras.
Não use o mesmo formato | Use formatos variados |
---|---|
Compre um bilhete para Seattle | Compre 1 bilhete para Seattle |
Compre um bilhete para Paris | Reserve dois ingressos no olho vermelho para Paris na próxima segunda-feira |
Compre um bilhete para Orlando | Eu gostaria de reservar 3 ingressos para Orlando para as férias de primavera |
A segunda coluna usa verbos diferentes (comprar, reservar, reservar), quantidades diferentes (1, e "dois", 3) e diferentes arranjos de palavras, mas todos têm a mesma intenção de comprar passagens aéreas para viajar.
Não adicione muitos exemplos de declarações às intenções
Depois que o aplicativo for publicado, adicione apenas expressões da aprendizagem ativa no processo de ciclo de vida do desenvolvimento. Se os enunciados forem muito semelhantes, adicione um padrão.