Gerenciar projetos de rotulagem

Saiba como gerenciar um projeto de rotulagem no Azure Machine Learning. Este artigo destina-se aos gerentes de projeto responsáveis pelo gerenciamento de projetos de rotulagem de texto ou imagem. Para obter informações sobre como criar o projeto, confira Configurar um projeto de rotulagem de texto ou Configurar um projeto de rotulagem de imagem.

Importante

Os itens marcados (versão prévia) neste artigo estão atualmente em versão prévia pública. A versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.

Executar e monitorar o projeto

Depois de inicializar o projeto, o Azure começará a executá-lo. Para gerenciar um projeto, selecione-o na página principal Rotulagem de Dados.

Para pausar ou reiniciar o projeto, na barra de comandos do projeto, alterne o status Em Execução. Você pode rotular os dados somente quando o projeto estiver em execução.

Monitorar o progresso

A guia Painel mostra o progresso da tarefa de rotulagem.

Captura de tela mostrando o painel de rotulagem de dados.

Os gráficos de progresso mostram quantos itens foram rotulados, pulados, precisam de revisão ou ainda não foram concluídos. Passe o mouse sobre o gráfico para ver o número de itens em cada seção.

Uma distribuição dos rótulos para as tarefas concluídas é mostrada abaixo do gráfico. Em alguns tipos de projeto, um item pode ter vários rótulos. O número total de rótulos pode exceder o número total de itens.

Também é mostrada uma distribuição dos rotuladores e quantos itens eles rotularam.

A seção do meio mostra uma tabela que tem uma fila de tarefas não atribuídas. Quando a rotulagem assistida por ML está desativada, esta seção mostra o número de tarefas manuais que estão aguardando atribuição.

Quando a rotulagem assistida por ML estiver ativada, esta seção também mostrará:

  • Tarefas que contêm itens clusterizados na fila.
  • Tarefas que contêm itens pré-rotulados na fila.

Além disso, quando a rotulagem assistida por ML estiver habilitada, você poderá rolar para baixo para ver o status da rotulagem assistida por ML. As seções Trabalhos fornecem links para cada uma das execuções de aprendizado de máquina.

  • Treinamento: treina um modelo para prever os rótulos.
  • Validação: determina se a pré-rotulagem de itens usa a previsão desse modelo.
  • Inferência: execução da previsão para novos itens.
  • Engenharia de recursos: itens de clusters (apenas para projetos de classificação de imagem).

Revisar dados e rótulos

Na guia Dados, pré-visualize o conjunto de dados e revise os dados rotulados.

Dica

Antes de realizar uma revisão, é necessário coordenar suas ações com as ações de outros possíveis revisores. Caso contrário, vocês poderão estar tentando aprovar o mesmo rótulo ao mesmo tempo, o que impedirá que um de vocês realize as atualizações.

Percorra os dados rotulados para ver os rótulos. Se você vir dados que estejam incorretamente rotulados, selecione-os e escolha Rejeitar para remover os rótulos e retornar os dados para a fila não rotulada.

Itens ignorados

Um conjunto de filtros se aplica aos itens que você está revisando. Por padrão, revise os dados rotulados. Selecione o filtro Tipo de ativo para alternar o tipo para *Ignorado para revisar os itens que foram ignorados.

A captura de tela mostra os filtros para revisar rótulos.

Se você achar que os dados ignorados devem ser rotulados, selecione Rejeitar para colocá-los de volta na fila sem rótulos. Se achar que os dados ignorados não são relevantes para o seu projeto, selecione Aceitar para removê-los do projeto.

Rotulagem por Consenso

Se seu projeto utiliza rotulagem de consenso, examine as imagens que não têm consenso:

  1. Selecione a guia Dados .

  2. No menu à esquerda, selecione Examinar Rótulos.

  3. Na barra de comandos acima de Examinar Rótulos, selecione Todos os filtros.

    Captura de tela mostrando como selecionar filtros para revisar problemas de rótulos de consenso.

  4. Em Pontos de dados rotulados , selecione Rótulos de consenso que precisam de revisão para mostrar apenas as imagens para as quais os rotuladores não chegaram a um consenso.

    Captura de tela mostrando como selecionar os rótulos que precisam de revisão.

  5. Para cada imagem a ser revisada, selecione o menu suspenso Rótulo de consenso para exibir os rótulos conflitantes.

    Captura de tela mostrando o menu suspenso Selecionar rótulo de consenso para revisar os rótulos conflitantes.

  6. Embora você possa selecionar um rotulador individual para ver seus rótulos, para atualizar ou rejeitar os rótulos, você deve usar a opção superior, Rótulo de consenso (pré-visualização).

Alterar os detalhes do projeto

Visualize e altere os detalhes do seu projeto na guia Detalhes. Nessa guia, é possível:

  • Exibir os detalhes do projeto e os conjuntos de dados de entrada.
  • Defina ou desmarque a opção Habilitar atualização incremental em intervalos regulares ou solicite uma atualização imediata.
  • Exiba os detalhes do contêiner de armazenamento usado para armazenar as saídas rotuladas no seu projeto.
  • Adicione rótulos ao seu projeto.
  • Edite as instruções que você dá aos rótulos.
  • Altere as configurações para a rotulagem assistida por ML e inicie uma tarefa de rotulagem.

Projetos criados nos serviços de IA do Azure

Se o seu projeto de rotulagem tiver sido criado a partir do Visão Studio ou do Estúdio de Idiomas, você verá uma guia extra na página Detalhes. A guia permite alternar entre a rotulagem no Azure Machine Learning e a rotulagem no Estúdio do Visão ou no Estúdio de Idiomas.

Se o projeto tiver sido criado a partir do Vision Studio, você também verá uma guia do Vision Studio. Selecione Ir para o Vision Studio para retornar ao Vision Studio. Ao retornar ao Estúdio do Visão, você poderá importar seus dados rotulados.

Adicionar novos rótulos a um projeto

Durante o processo de rotulagem de dados, adicione mais rótulos para classificar seus itens. Por exemplo, convém adicionar um rótulo Desconhecido ou Outro para indicar confusão.

Para adicionar um ou mais rótulos a um projeto:

  1. Selecione o projeto na página principal Rotulagem de Dados.

  2. Na barra de comando do projeto, alterne o status de Em Execução para Pausado para interromper a atividade de rotulagem.

  3. Selecione a guia Detalhes.

  4. Na lista à esquerda, selecione Categorias de rótulo.

  5. Modifique os rótulos.

    Captura de tela mostrando como adicionar um rótulo no Estúdio do Azure Machine Learning.

  6. No formulário, adicione seu novo rótulo. Em seguida, escolha como continuar o projeto. Como você alterou os rótulos disponíveis, escolha como tratar os dados que já estão rotulados:

    • Recomece e remova todos os rótulos existentes. Escolha esta opção se desejar começar a rotular desde o início usando o novo conjunto completo de rótulos.
    • Recomece e mantenha todos os rótulos existentes. Escolha esta opção para marcar todos os dados como sem rótulo, mas mantenha os rótulos existentes como uma marca padrão para imagens que foram rotuladas anteriormente.
    • Continue e mantenha todos os rótulos existentes. Escolha esta opção para manter todos os dados já rotulados como estão e comece a usar o novo rótulo para os dados que ainda não estão rotulados.
  7. Modifique sua página de instruções conforme necessário para novos rótulos.

  8. Depois de adicionar todos os novos rótulos, alterne Pausado para Em Execução para reiniciar o projeto.

Iniciar uma tarefa de rotulagem assistida por ML

A rotulagem assistida por ML começa automaticamente após alguns itens terem sido rotulados. Esse limite automático varia de acordo com o projeto. Você pode iniciar manualmente uma execução de treinamento assistida por ML se seu projeto contiver pelo menos alguns dados rotulados.

Observação

O treinamento sob demanda não está disponível para projetos criados antes de dezembro de 2022. Crie um novo projeto para usar este recurso.

Para iniciar uma nova execução de treinamento assistida por ML:

  1. Na parte superior do projeto, selecione Detalhes.
  2. No menu esquerdo, selecione Rotulagem assistida por ML.
  3. Perto do final da página, para Treinamento sob demanda, selecione Iniciar.

Exportar os rótulos

Para exportar os rótulos, na barra de comandos do projeto, selecione o botão Exportar. Você pode exportar os dados de rótulo para experimentação no Machine Learning a qualquer momento.

Se o tipo de projeto for segmentação semântica (versão prévia), um Ativos de dados do Azure MLTable será criado.

Para todos os outros tipos de projeto, você pode exportar um rótulo de imagem como:

  • Um arquivo CSV. O Azure Machine Learning cria o arquivo CSV em uma pasta dentro de Labeling/export/csv.
  • Um arquivo no formato COCO. O Azure Machine Learning cria o arquivo COCO em uma pasta dentro de Labeling/export/coco.
  • Um ativo de dados do Azure MLTable.

Quando você exporta um arquivo CSV ou COCO, uma notificação é exibida brevemente quando o arquivo está pronto para download. Selecione o link Baixar arquivo para baixar seus resultados. Você também pode encontrar a notificação na seção Notificação na barra superior:

Captura de tela mostrando a notificação para o download do arquivo.

Acesse os conjuntos de dados exportados do Azure Machine Learning na seção Dados do Machine Learning. A página de detalhes do conjunto de dados também fornece exemplos de códigos que você pode usar para acessar seus rótulos usando Python.

Captura de tela mostrando um exemplo da página de detalhes do conjunto de dados no Machine Learning.

Depois de exportar seus dados rotulados para um conjunto de dados do Azure Machine Learning, você pode usar o AutoML para criar modelos de pesquisa visual computacional que são treinados em seus dados rotulados. Saiba mais em Configurar o AutoML para treinar modelos de pesquisa visual computacional usando Python.

Importar rótulos (versão prévia)

Se tiver um ativo de dados MLTable do Azure ou um arquivo COCO que contenha rótulos para seus dados atuais, você poderá importar esses rótulos para seu projeto. Por exemplo, você pode ter rótulos que foram exportadas de um projeto de rotulagem anterior usando os mesmos dados. O recurso de importação de rótulos está disponível apenas para projetos de imagem.

Para importar rótulos, na barra de comando do projeto, selecione o botão Importar. Você pode importar dados rotulados para experimentação do aprendizado de máquina a qualquer momento.

Importar de um arquivo COCO ou de um ativo de dados MLTable do Azure.

Mapeamento de dados

Você deve especificar uma coluna que mapeie o campo Imagem. Opcionalmente, você também pode mapear outras colunas presentes nos dados. Por exemplo, se os dados contiverem uma coluna Rótulo, você poderá mapeá-la para o campo Categoria. Se os dados contiverem uma coluna Confiança, você poderá mapeá-la para o campo Confiança.

Se estiver importando rótulos de um projeto anterior, os rótulos deverão estar no mesmo formato dos rótulos que você está criando. Por exemplo, se você estiver criando rótulos de caixa delimitadora, os rótulos importados também deverão ser rótulos de caixa delimitadora.

Opções de importação

Escolha como tratar os rótulos importados:

  • Como dados pré-rotulados, escolha essa opção para usar os rótulos importados como dados pré-rotulados. Em seguida, o rotulador pode examinar os dados pré-rotulados e corrigir quaisquer erros antes de enviar os rótulos.
  • Como rótulos finais, escolha essa opção para importar os rótulos como rótulos finais. Somente os dados que ainda não contêm um rótulo são apresentados como tarefas para seus rotuladores.

Acesso a rotuladores

Qualquer pessoa que tenha acesso de Colaborador ou Proprietário ao seu workspace pode rotular dados em seu projeto.

Você também pode adicionar usuários e personalizar as permissões para que eles possam acessar a rotulagem, mas não outras partes do workspace ou do seu projeto de rotulagem. Para obter mais informações, consulte Adicionar usuários ao seu projeto de rotulagem de dados.

Solucionar problemas

Use estas dicas se você encontrar algum dos seguintes problemas ao gerenciar seu projeto:

Problema Resolução
Somente conjuntos de dados criados em armazenamentos de dados de um blob poderão ser usados. Esse problema é uma limitação conhecida da versão atual.
A remoção de dados do conjunto de dados que seu projeto utiliza causa um erro no projeto. Não remova dados da versão do conjunto de dados usado em um projeto de rotulagem. Crie uma nova versão de conjunto de dados para remover dados.
Após a criação de um projeto, seu status será Inicializando por um tempo estendido. Atualize a página de modo manual. A inicialização deverá ser concluída em cerca de 20 pontos de dados por segundo. Nenhuma atualização automática é um problema conhecido.
Os itens recém-rotulados não estão visíveis na revisão de dados. Para carregar todos os itens rotulados, selecione o botão Primeiro. O botão Primeiro leva você de volta para a frente da lista e carrega todos os dados rotulados.
Você não pode atribuir um conjunto de tarefas a um rotulador específico. Esse problema é uma limitação conhecida da versão atual.

Solução de problemas de detecção de objetos

Problema Resolução
Se você selecionar a tecla Esc quando rotular para detecção de objetos, um rótulo de tamanho zero será criado e o envio do rótulo falhará. Para excluir o rótulo, selecione o ícone de exclusão X ao lado do rótulo.

Se você tiver problemas ao criar o projeto, veja Solucionar problemas durante a criação de um projeto de rotulagem de dados

Próxima etapa

Rotulagem de imagens e documentos de texto