Explorando o modelo de árvore de decisão (Tutorial de mineração de dados básico)
O algoritmo Árvores de Decisão da Microsoft prevê que colunas influenciam a decisão de compra de uma bicicleta com base nas colunas restantes do conjunto de treinamento.
O Visualizador de Árvore de Decisão da Microsoft fornece as seguintes guias para serem usadas na exploração de modelos de mineração de árvore de decisão:
Árvore de Decisão
Rede de Dependências
As seções a seguir descrevem como selecionar o visualizador apropriado e explorar os outros modelos de mineração.
Explorando o modelo de clustering (Tutorial de mineração de dados básico)
Explorando o modelo Naive Bayes (Tutorial de mineração de dados básico)
Na guia Árvore de Decisão, examine todos os três modelos que formam um modelo de mineração.
Uma vez que o modelo de correspondência destinada neste projeto de tutorial contém apenas um único atributo previsível, Bike Buyer, há somente uma única árvore a ser exibida. Se houver mais árvores, você pode usar a caixa Árvore para escolher outra árvore.
A revisão do modelo TM_Decision_Tree no visualizador Árvore de Decisão revela que a idade é o único fator importante na previsão da compra de bicicletas. O interessante é que, uma vez que você agrupa os clientes por idade, a próxima ramificação da árvore será diferente para cada nó de idade. Ao explorar a guia Árvore de Decisão, podemos concluir que os compradores entre 34 e 40 anos com um ou nenhum carro têm grande probabilidade de comprar uma bicicleta e que clientes mais novos e solteiros que vivem na região do Pacífico e que têm um ou nenhum carro também têm grande probabilidade de comprar uma bicicleta.
Selecione a guia Visualizador do Modelo de Mineração no Designer de Mineração de Dados.
Por padrão, o designer é aberto no primeiro modelo adicionado à estrutura -- nesse caso, TM_Decision_Tree.
Use os botões de lente de aumento para ajustar o tamanho da exibição da árvore.
Por padrão, o Visualizador de Árvore da Microsoft mostra somente os três primeiros níveis da árvore. Se a árvore tiver menos de três níveis, o visualizador mostrará só os níveis existentes. Você pode exibir mais níveis usando o controle deslizante Mostrar Nível ou a lista Expansão Padrão.
Deslize Mostrar Nível até a quarta barra.
Altere o valor de Plano de Fundo para 1.
Ao alterar a configuração Plano de Fundo, você poderá visualizar rapidamente o número de casos em cada nó que têm o valor de destino 1 para [Bike Buyer]. Lembre-se de que neste cenário específico, cada caso representa um cliente. O valor 1 indica que o cliente comprou uma bicicleta antes; o valor 0 indica que o cliente nunca comprou uma bicicleta. Quanto mais escuro for o sombreamento do nó, maior será a porcentagem de casos desse nó com o valor de destino.
Posicione o seu cursor sobre o nó chamado Todos. Uma dica de ferramenta será exibida com as seguintes informações:
Número total de casos
Número de casos de pessoas que não compram bicicleta
Número de casos de compradores de bicicleta
Número de casos com valores ausentes para [Bike Buyer]
Como alternativa, coloque o seu cursor sobre qualquer nó da árvore para ver a condição exigida para alcançar aquele nó a partir do nó anterior. Também é possível exibir essas informações em Legenda de Mineração.
Clique no nó para Idade >=34 e < 41. O histograma é exibido como uma barra horizontal final no nó e representa a distribuição de clientes nesse intervalo de idade que compraram (rosa) e que não compraram (azul) uma bicicleta anteriormente. O Visualizador nos mostra que os clientes entre os 34 e os 40 anos com um ou nenhum carro têm probabilidade de comprar uma bicicleta. Levando isso um pouco mais adiante, descobrimos que a probabilidade de compra de uma bicicleta aumenta caso o cliente tenha realmente entre 38 e 40 anos.
Como você habilitou o detalhamento quando criou a estrutura e o modelo, poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, incluindo as colunas não incluídas no modelo de mineração (por exemplo, emailAddress, FirstName).
Para obter mais informações, consulte Consultas de detalhamento (mineração de dados).
Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo Somente.
Os detalhes para cada caso de treinamento são exibidos em formato de planilha. Esses detalhes vêm da exibição vTargetMail, selecionada como a tabela de casos durante a criação da estrutura de mineração.
Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo e da Estrutura.
A mesma planilha será exibida com as colunas da estrutura anexadas no final.
Voltar ao início
A guia Rede de Dependências exibe os relacionamentos entre os atributos que contribuem para a capacidade de previsão do modelo de mineração. O visualizador Rede de Dependências reforça as nossas descobertas de que Idade e Região são fatores importantes na previsão de compra de bicicletas.
Clique no nó Comprador de Bicicleta para identificar suas dependências.
O nó central para a rede de dependências, Comprador de Bicicleta, representa o atributo previsível no modelo de mineração. O sombreamento rosa indica que todos os atributos influenciam a compra de bicicletas.
Ajuste o controle deslizante Todos os Links para identificar o atributo mais influente.
À medida que você abaixa o controle deslizante, apenas os atributos com o efeito maior sobre a coluna [Bike Buyer] permanecem. Ajustando o controle deslizante, você poderá descobrir que idade e região são os principais fatores para determinar se alguém é um comprador de bicicletas.
Explorando o modelo de clustering (Tutorial de mineração de dados básico)
Guia Árvore de Decisão (Visualizador do Modelo de Mineração)
Guia Rede de Dependências (Visualizador do Modelo de Mineração)