Rotule dados de texto para treinar seu modelo para análise de sentimento personalizada

Antes de treinar seu modelo, você precisa rotular seus documentos com os sentimentos em que deseja categorizá-los. Esses dados serão usados na próxima etapa ao treinar seu modelo para que ele possa aprender com os dados rotulados. Se você já tiver dados rotulados, poderá importá-los diretamente para seu projeto. Certifique-se de que os seus dados seguem o formato de dados aceite.

Antes de criar um modelo de análise de sentimento personalizado, você precisa ter os dados rotulados primeiro. Se seus dados ainda não estiverem rotulados, você poderá rotulá-los no Language Studio. Os dados rotulados informam ao modelo como interpretar o texto e são usados para treinamento e avaliação.

Pré-requisitos

Antes de rotular dados, você precisa:

  • Um projeto criado com êxito com uma conta de armazenamento de blob do Azure configurada.
  • Documentos que contêm dados de texto que foram carregados para a sua conta de armazenamento.

Consulte o ciclo de vida de desenvolvimento do projeto para obter mais informações.

Diretrizes de rotulagem de dados

Depois de preparar seus dados e criar seu projeto, você precisará rotular seus dados. Rotular seus dados é importante para que seu modelo saiba quais documentos serão associados aos sentimentos de que você precisa. Quando você rotula seus dados no Language Studio (ou importa dados rotulados), esses rótulos serão armazenados no arquivo JSON no contêiner de armazenamento que você conectou a este projeto.

Ao rotular seus dados, lembre-se:

  • Em geral, dados mais rotulados levam a melhores resultados, desde que os dados sejam rotulados com precisão.

  • Não existe um número fixo de etiquetas que possa garantir que o seu modelo terá o melhor desempenho. Modele o desempenho sobre a possível ambiguidade em seus dados e a qualidade de seus dados rotulados.

Rotule seus dados

Use as seguintes etapas para rotular seus dados:

  1. Aceda à página do seu projeto no Language Studio.

  2. No menu do lado esquerdo, selecione Rotulagem de dados. Você pode encontrar uma lista de todos os documentos em seu contêiner de armazenamento.

    Gorjeta

    Você pode usar os filtros no menu superior para visualizar os arquivos sem rótulo para que você possa começar a rotulá-los. Você também pode usar os filtros para exibir os documentos rotulados com um sentimento específico.

  3. Mude para uma visualização de arquivo único do lado esquerdo no menu superior ou selecione um arquivo específico para começar a rotular. Você pode encontrar uma lista de todos os .txt arquivos disponíveis em seus projetos à esquerda. Você pode usar o botão Voltar e Avançar na parte inferior da página para navegar pelos documentos.

    Nota

    Se tiver ativado vários idiomas para o seu projeto, encontrará uma lista pendente Idioma no menu superior, que lhe permite selecionar o idioma de cada documento.

  4. No painel do lado direito, você pode adicionar sentimentos ao seu projeto para começar a rotular seus dados com eles.

  5. No painel do lado direito, sob o pivô Rótulos, você pode encontrar todos os sentimentos em seu projeto e a contagem de instâncias rotuladas para cada um.

  6. Na seção inferior do painel lateral direito, você pode adicionar o arquivo atual que está visualizando ao conjunto de treinamento ou ao conjunto de testes. Por padrão, todos os documentos são adicionados ao seu conjunto de treinamento. Saiba mais sobre conjuntos de treinamento e teste e como eles são usados para treinamento e avaliação de modelos.

    Gorjeta

    Se você estiver planejando usar a divisão automática de dados, use a opção padrão de atribuir todos os documentos ao seu conjunto de treinamento.

  7. No pivô Distribuição, você pode exibir a distribuição entre conjuntos de treinamento e teste. Você tem duas opções para visualizar:

    • Total de instâncias em que você pode visualizar a contagem de todas as instâncias rotuladas de um sentimento específico.
    • Documentos com pelo menos um rótulo em que cada documento é contado se contiver pelo menos uma instância rotulada desse sentimento.
  8. Enquanto você estiver rotulando, suas alterações serão sincronizadas periodicamente, se ainda não tiverem sido salvas, você encontrará um aviso na parte superior da página. Se quiser guardar manualmente, clique no botão Guardar etiquetas na parte inferior da página.

Próximos passos

Depois de rotular seus dados, você pode começar a treinar um modelo que aprenderá com base em seus dados.