Explorando o modelo de árvore de decisão (Tutorial de mineração de dados básico)

O algoritmo Árvores de Decisão da Microsoft prevê que colunas influenciam a decisão de compra de uma bicicleta com base nas colunas restantes do conjunto de treinamento.

O Visualizador de Árvore de Decisão da Microsoft fornece as seguintes guias para serem usadas na exploração de modelos de mineração de árvore de decisão:

Árvore de Decisão

Rede de Dependências

As seções a seguir descrevem como selecionar o visualizador apropriado e explorar os outros modelos de mineração.

Guia Árvore de Decisão

Na guia Árvore de Decisão, examine todos os três modelos que formam um modelo de mineração.

Uma vez que o modelo de correspondência destinada neste projeto de tutorial contém apenas um único atributo previsível, Bike Buyer, há somente uma única árvore a ser exibida. Se houver mais árvores, você pode usar a caixa Árvore para escolher outra árvore.

A revisão do modelo TM_Decision_Tree no visualizador Árvore de Decisão revela que a idade é o único fator importante na previsão da compra de bicicletas. O interessante é que, uma vez que você agrupa os clientes por idade, a próxima ramificação da árvore será diferente para cada nó de idade. Ao explorar a guia Árvore de Decisão, podemos concluir que os compradores entre 34 e 40 anos com um ou nenhum carro têm grande probabilidade de comprar uma bicicleta e que clientes mais novos e solteiros que vivem na região do Pacífico e que têm um ou nenhum carro também têm grande probabilidade de comprar uma bicicleta.

Para explorar o modelo na guia Árvore de Decisão

  1. Selecione a guia Visualizador do Modelo de Mineração no Designer de Mineração de Dados.

    Por padrão, o designer é aberto no primeiro modelo adicionado à estrutura -- nesse caso, TM_Decision_Tree.

  2. Use os botões de lente de aumento para ajustar o tamanho da exibição da árvore.

    Por padrão, o Visualizador de Árvore da Microsoft mostra somente os três primeiros níveis da árvore. Se a árvore tiver menos de três níveis, o visualizador mostrará só os níveis existentes. Você pode exibir mais níveis usando o controle deslizante Mostrar Nível ou a lista Expansão Padrão.

  3. Deslize Mostrar Nível até a quarta barra.

  4. Altere o valor de Plano de Fundo para 1.

    Ao alterar a configuração Plano de Fundo, você poderá visualizar rapidamente o número de casos em cada nó que têm o valor de destino 1 para [Bike Buyer]. Lembre-se de que neste cenário específico, cada caso representa um cliente. O valor 1 indica que o cliente comprou uma bicicleta antes; o valor 0 indica que o cliente nunca comprou uma bicicleta. Quanto mais escuro for o sombreamento do nó, maior será a porcentagem de casos desse nó com o valor de destino.

  5. Posicione o seu cursor sobre o nó chamado Todos. Uma dica de ferramenta será exibida com as seguintes informações:

    • Número total de casos

    • Número de casos de pessoas que não compram bicicleta

    • Número de casos de compradores de bicicleta

    • Número de casos com valores ausentes para [Bike Buyer]

    Como alternativa, coloque o seu cursor sobre qualquer nó da árvore para ver a condição exigida para alcançar aquele nó a partir do nó anterior. Também é possível exibir essas informações em Legenda de Mineração.

  6. Clique no nó para Idade >=34 e < 41. O histograma é exibido como uma barra horizontal final no nó e representa a distribuição de clientes nesse intervalo de idade que compraram (rosa) e que não compraram (azul) uma bicicleta anteriormente. O Visualizador nos mostra que os clientes entre os 34 e os 40 anos com um ou nenhum carro têm probabilidade de comprar uma bicicleta. Levando isso um pouco mais adiante, descobrimos que a probabilidade de compra de uma bicicleta aumenta caso o cliente tenha realmente entre 38 e 40 anos.

Como você habilitou o detalhamento quando criou a estrutura e o modelo, poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, incluindo as colunas não incluídas no modelo de mineração (por exemplo, emailAddress, FirstName).

Para obter mais informações, consulte Consultas de detalhamento (mineração de dados).

Para detalhar os dados de caso

  1. Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo Somente.

    Os detalhes para cada caso de treinamento são exibidos em formato de planilha. Esses detalhes vêm da exibição vTargetMail, selecionada como a tabela de casos durante a criação da estrutura de mineração.

  2. Clique com o botão direito do mouse em um nó e selecione Detalhar e Colunas do Modelo e da Estrutura.

    A mesma planilha será exibida com as colunas da estrutura anexadas no final.

Voltar ao início

Guia Rede de Dependências

A guia Rede de Dependências exibe os relacionamentos entre os atributos que contribuem para a capacidade de previsão do modelo de mineração. O visualizador Rede de Dependências reforça as nossas descobertas de que Idade e Região são fatores importantes na previsão de compra de bicicletas.

Para explorar o modelo na guia Rede de Dependências

  1. Clique no nó Comprador de Bicicleta para identificar suas dependências.

    O nó central para a rede de dependências, Comprador de Bicicleta, representa o atributo previsível no modelo de mineração. O sombreamento rosa indica que todos os atributos influenciam a compra de bicicletas.

  2. Ajuste o controle deslizante Todos os Links para identificar o atributo mais influente.

    À medida que você abaixa o controle deslizante, apenas os atributos com o efeito maior sobre a coluna [Bike Buyer] permanecem. Ajustando o controle deslizante, você poderá descobrir que idade e região são os principais fatores para determinar se alguém é um comprador de bicicletas.

Próxima tarefa na lição

Explorando o modelo de clustering (Tutorial de mineração de dados básico)

Consulte também

Referência

Guia Árvore de Decisão (Visualizador do Modelo de Mineração)

Guia Rede de Dependências (Visualizador do Modelo de Mineração)

Conceitos

Procurar um modelo usando a Exibição de Árvore da Microsoft

Outros recursos

Tarefas e instruções do visualizador do modelo de mineração