Início Rápido: criar um detector de objeto com o site da Visão Personalizada

Neste guia início rápido, você aprenderá a usar o site da Visão Personalizada para criar um modelo de detector de objetos. Depois de criar um modelo, você poderá testá-lo com novas imagens e integrá-lo ao próprio aplicativo de reconhecimento de imagem.

Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Criar recursos de Visão Personalizada

Para usar o Serviço de Visão Personalizada, você precisará criar os recursos de Treinamento e Previsão da Visão Personalizada no Azure. Para fazer isso no portal do Azure, preencha a janela da caixa de diálogo na página Criar Visão Personalizada para criar um recurso de treinamento e de previsão.

Criar um novo projeto

No navegador da Web, navegue até o site Visão Personalizada e selecione Entrar. Entre com a mesma conta usada para entrar no portal do Azure.

Imagem da página de entrada

  1. Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.

    A caixa de diálogo do novo projeto tem campos para nome, descrição e domínios.

  2. Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.

    Observação

    Se nenhum recurso estiver disponível, confirme se você fez logon em customvision.ai com a mesma conta que foi usada para entrar no portal do Azure. Além disso, confirme se você selecionou o mesmo "Diretório" no site da Visão Personalizada como o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, é possível selecionar seu diretório no menu suspenso de conta no canto superior direito da tela.

  3. No nó

  4. Selecione Detecção de Objetos em Tipos de Projeto.

  5. Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o detector para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.

    Domínio Finalidade
    Geral Otimizado para uma ampla variedade de tarefas de detecção de objetos. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Geral.
    Logotipo Otimizado para localizar logotipos de marcas em imagens.
    Produtos em prateleiras Otimizado para detectar e classificar produtos em prateleiras.
    Domínios compactos Otimizados para as restrições da detecção de objetos em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente.
  6. Por fim, selecione Criar projeto.

Escolher imagens de treinamento

É recomendável usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Também é conveniente coletar algumas imagens adicionais para testar o seu modelo após o treinamento.

Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:

  • ângulo da câmera
  • iluminação
  • background
  • estilo do visual
  • assuntos individuais/agrupados
  • tamanho
  • type

Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:

  • Formato .jpg, .png, .bmp ou .gif
  • não ultrapasse 6 MB em tamanho (4 MB para imagens de previsão)
  • não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será escalada verticalmente de maneira automática pelo Serviço de Visão Personalizada

Carregar e marcar imagens

Nesta seção, você carrega e marca manualmente imagens para ajudar a treinar o detector.

  1. Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para carregar as imagens.

    O controle de adição de imagens é mostrado no canto superior esquerdo e como um botão na parte inferior central.

  2. Você verá as imagens carregadas na seção Sem marcas da interface do usuário. A próxima etapa é marcar manualmente os objetos que você deseja que o detector aprenda a reconhecer. Selecione primeira imagem para abrir a janela da caixa de diálogo de marcação.

    Imagens carregadas, na seção Sem marcas

  3. Selecione e arraste um retângulo em torno do objeto na sua imagem. Em seguida, insira um novo nome de marca com o botão + ou selecione uma marca existente na lista suspensa. É importante marcar todas as instâncias dos objetos que você deseja detectar, pois o detector usa a área da tela de fundo sem marcas como um exemplo negativo no treinamento. Quando concluir a marcação, clique na seta à direita para salvar as marcas e passar para a próxima imagem.

    Como marcar um objeto com uma seleção retangular

Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.

Treinar o detector

Para treinar o modelo de detector, selecione o botão Treinar. O detector usa todas as imagens atuais e suas marcas para criar um modelo que identifica cada objeto marcado. Esse processo pode levar vários minutos.

Botão Treinar no canto superior direito na barra de ferramentas do cabeçalho da página da Web

O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.

A janela do navegador com uma caixa de diálogo de treinamento na seção principal

Avaliar o detector

Depois que o treinamento for concluído, o desempenho do modelo será calculado e exibido. O serviço de Visão Personalizada usa as imagens que você enviou para treinamento a fim de calcular a precisão, o recall e a precisão média. A precisão e o recall são duas medidas diferentes da eficácia de um detector:

  • A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
  • A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.
  • A média da precisão média é o valor médio da AP (precisão média). A AP é a área sob a curva de precisão/recall (a precisão é plotada em relação à recuperação para cada previsão feita).

Os resultados do treinamento mostram a precisão e o recall gerais, bem como a precisão média.

Limite de probabilidade

Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correto (para fins de cálculo de precisão e recall).

Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.

Limite de sobreposição

O controle deslizante do Limite de Sobreposição aborda o quão correta deve ser uma previsão de objeto para que seja considerada "correta" no treinamento. Ele define a sobreposição mínima permitida entre a caixa delimitadora do objeto previsto e a caixa delimitadora real inserida pelo usuário. Se as caixas delimitadoras não se sobrepuserem a esse grau, a previsão não será considerada correta.

Gerenciar iterações de treinamento

Sempre que treinar o detector, você criará uma iteração com suas próprias métricas de desempenho atualizadas. É possível exibir todas as iterações no painel à esquerda da guia Desempenho. No painel à esquerda, também é possível encontrar o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.

Confira Usar o modelo com a API de previsão para saber como acessar seus modelos treinados de maneira programática.

Próximas etapas

Neste início rápido, você aprendeu a criar e treinar um modelo de detector de objeto usando o site da Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.