Treinar Modelo de Clustering
Este artigo descreve o componente no designer do Azure Machine Learning.
Use este componente para treinar um modelo de clustering.
O componente usa um modelo de clustering não treinado que você já configurou usando o componente Clustering K-Means e treina o modelo usando um conjunto de dados com ou sem rótulo. O componente cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.
Observação
Um modelo de clustering não pode ser treinado usando o componente Treinar Modelo, que é o componente genérico para treinar modelos de machine learning. Isso ocorre porque o módulo Treinar Modelo funciona apenas com algoritmos de aprendizado supervisionados. K-means e outros algoritmos de clustering possibilitam o aprendizado não supervisionado, o que significa que o algoritmo pode aprender com dados sem rótulos.
Como usar o módulo Treinar Modelo de Clustering
Adicione o componente Treinar Modelo de Clustering ao pipeline no designer. Você pode encontrar esse componente em Componentes de Machine Learning na categoria Treinar.
Adicione o componente Clustering K-Means, ou outro componente personalizado que cria um modelo de clustering compatível, e defina os parâmetros do modelo de clustering.
Anexe um conjunto de dados de treinamento na entrada à direita do módulo Treinar Modelo de Clustering.
No Conjunto de Colunas, escolha as colunas do conjunto de dados que for usar na criação de clusters. Certifique-se de selecionar as colunas que tenham bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos ou que tenham os mesmos valores.
Se um rótulo está disponível, você pode usá-lo como um recurso ou deixá-lo de fora.
Selecione a opção marque para acrescentar ou desmarque apenas para o resultado se desejar fazer a saída dos dados de treinamento junto com o novo rótulo de cluster.
Somente as atribuições de cluster farão a saída se você não selecionar essa opção.
Envie o pipeline ou clique no componente Treinar Modelo de Clustering e selecione Executar Item Selecionado.
Resultados
Após a conclusão do treinamento:
Para salvar um instantâneo do modelo treinado, escolha a guia Saídas no painel direito do componente Treinar modelo. Escolha o ícone Registrar conjunto de dados para salvá-lo como um componente reutilizável.
Use Atribuir Dados a Clusters para gerar as pontuações do modelo.
Observação
Se você precisar implantar o modelo treinado no designer, certifique-se de que Atribuir Dados a Clusters (e não o Modelo de Pontuação) esteja conectado à entrada do Componente de Saída do Serviço Web no pipeline de inferência.
Próximas etapas
Confira o conjunto de componentes disponíveis no Azure Machine Learning.