Treinar e avaliar um modelo

Concluído

O treinamento e a avaliação de um modelo é o processo iterativo de adicionar dados e rótulos ao conjunto de dados de treinamento para ensinar o modelo com mais precisão. Para saber quais tipos de dados e de rótulos precisam ser aprimorados, o Language Studio fornece uma pontuação na página Exibir detalhes do modelo no painel esquerdo.

Screenshot of the View model scoring tab.

As entidades individuais e a pontuação geral do seu modelo são divididas em três métricas para explicar como elas estão se saindo e onde precisam de aperfeiçoamento.

Metric Descrição
Precisão A taxa de reconhecimentos bem-sucedidos de entidades para todas as tentativas de reconhecimento. Uma pontuação alta significa que, desde que a entidade seja reconhecida, ela será rotulada corretamente.
Chamar de volta A taxa de reconhecimentos bem-sucedidos de entidades em relação ao número real de entidades no documento. Uma pontuação alta significa que ele localiza bem a entidade ou as entidades, independentemente de atribuir a elas o rótulo certo
Medida f Combinação de precisão e recall fornecendo uma só métrica de pontuação

As pontuações estão disponíveis por entidade e para o modelo como um todo. Você pode encontrar uma entidade com boa pontuação, mas modelo todo não.

Como interpretar as métricas

O ideal é que nosso modelo pontue bem em termos de precisão e recall, o que significa que o reconhecimento de entidade funciona bem. Se ambas as métricas têm uma pontuação baixa, significa que o modelo está com dificuldades para reconhecer entidades no documento e, quando ele extrai essa entidade, não atribui o rótulo correto com alta confiança.

Se a precisão está baixa, mas o recall está alto, significa que o modelo reconhece bem a entidade, mas não a rotula com o tipo de entidade correto.

Se a precisão está alta, mas o recall está baixo, significa que o modelo nem sempre reconhece a entidade, mas quando o modelo extrai a entidade, o rótulo correto é aplicado.

Matriz de confusão

Na mesma página Exibir detalhes do modelo, há outra guia na parte superior da Matriz de confusão. Essa exibição fornece uma tabela visual de todas as entidades e do desempenho de cada uma delas, fornecendo uma exibição completa do modelo e de onde ele está ficando aquém.

Screenshot of a sample confusion matrix.

A matriz de confusão permite identificar visualmente onde adicionar dados para aprimorar o desempenho do modelo.