Explorando os modelos de cesta de compras (Tutorial de mineração de dados intermediário)

 

Publicado: dezembro de 2016

Aplicável a: SQL Server 2016 Preview

Agora que você criou o associação modelo, você pode explorá-lo usando o Microsoft Visualizador de associação no Visualizador do modelo de mineração Guia do Designer de mineração de dados. Este tutorial orienta você a usar o visualizador para explorar relacionamentos entre itens. O visualizador ajuda você a ver rapidamente quais produtos tendem a aparecer juntos e a obter uma ideia geral dos padrões emergentes.

O Microsoft Visualizador de associação contém três guias: regras, conjuntos de itens, e rede de dependência. Como cada guia revela uma exibição ligeiramente diferente dos dados, quando estiver explorando o modelo, normalmente você alternará entre os painéis diferentes várias vezes à medida que for procurando por ideias.

  • Guia rede de dependências

  • Guia conjuntos de itens

  • Guia regras

  • Visualizador de Conteúdo Genérico

Para este tutorial, você irá iniciar o rede de dependência guia e, em seguida, use o regras guia e conjuntos de itens guia para aprofundar sua compreensão dos relacionamentos revelados no visualizador. Você também usará o Microsoft genérico conteúdo Visualizador de árvore para recuperar estatísticas detalhadas para regras individuais ou conjuntos de itens.

Guia Rede de Dependências

Com o rede de dependência guia, você pode investigar a interação dos itens diferentes no modelo. Cada nó do visualizador representa um item, enquanto que as linhas entre eles representam as regras. Selecionando um nó, você pode ver quais outros nós preveem o item selecionado ou quais itens o item atual prevê. Em alguns casos, há uma associação bidirecional entre itens, significando que eles geralmente aparecem na mesma transação. Você pode fazer referência à legenda de cores na parte inferior da guia para determinar a direção da associação.

Uma linha conectando dois itens significa que é provável que esses itens apareçam em uma transação juntos. Em outras palavras, é provável que os clientes comprem esses itens juntos. O controle deslizante está associado à probabilidade da regra. Mova o controle deslizante para cima ou para baixo para filtrar associações fracas, o que significa regras com probabilidade baixa.

O gráfico de rede de dependência mostra regras de pares, que podem ser representadas logicamente como A->B, ou seja, se o Produto A for comprado, então é provável que o Produto B também será. O gráfico não pode mostrar regras do tipo AB->C. Se você mover o controle deslizante para mostrar todas as regras e ainda assim não ver linhas no gráfico, significa que não há regras de pares que atendam aos critérios dos parâmetros do algoritmo.

Você também pode localizar nós pelo nome, digitando as primeiras letras do nome do atributo. Para obter mais informações, consulte Caixa de diálogo Localizar Nó (Visualizador do modelo de mineração).

Para abrir o modo Associação no Visualizador de Regras de Associação da Microsoft

  1. Em Solution Explorer, clique duas vezes na estrutura associação.

  2. No Designer de Mineração de Dados, clique na guia Visualizador do Modelo de Mineração .

  3. Selecione a associação da lista de modelos de mineração de modelo de mineração lista suspensa.

Para navegar no gráfico de dependências e localizar nós específicos

  1. No Visualizador do modelo de mineração clique o rede de dependência guia.

  2. Clique em Ampliar várias vezes, até que você veja facilmente os rótulos para cada nó.

    Por padrão, o gráfico exibe todos os nós visíveis. Em um modelo complexo, pode haver muitos nós, fazendo com que cada nó fique muito pequeno.

  3. Clique o + entrar no canto inferior direito do visualizador e mantenha pressionado o botão do mouse para panorâmica do gráfico.

  4. No lado esquerdo do visualizador, arraste o controle deslizante para baixo, movendo-o de todos os Links (o padrão) na parte inferior do controle deslizante.

  5. O visualizador atualiza o gráfico para mostrar somente a associação mais forte, entre os itens Pneu de Passeio e Tubo de Pneu de Passeio.

  6. Clique no nó denominado tubo de pneu de passeio = existente.

    O gráfico é atualizado para realçar somente os itens com uma forte relação com esse item. Observe a direção da seta entre os dois itens.

  7. No lado esquerdo do visualizador, arraste o controle deslizante para cima novamente, movendo-o da parte inferior para a parte intermediária.

    Observe as mudanças ocorridas na seta que conecta os dois itens.

  8. Selecione Mostrar apenas nome de atributo na lista suspensa na parte superior do painel de rede de dependências.

    Os rótulos de texto do gráfico são atualizados para mostrarem somente o nome do modelo.

Voltar ao Início

Guia Conjuntos de Itens

Em seguida, você aprenderá mais sobre as regras e conjuntos de itens gerados pelo modelo para os produtos Pneu de Passeio e Tubo de Pneu de Passeio. O conjuntos de itens guia exibe três partes de informações importantes que se relacionam com os conjuntos de itens que o Microsoft descobre algoritmo de associação:

  • **Suporte:**o número de transações em que o conjunto de itens ocorre.

  • **Tamanho:**o número de itens no conjunto de itens.

  • **Itens:**uma lista de itens que estão incluídos em cada conjunto de itens.

Dependendo como os parâmetros do algoritmo são definidos, o algoritmo poderia gerar muitos conjuntos de itens. Cada conjunto de itens retornado no visualizador representa as transações nas quais um item foi vendido. Usando os controles na parte superior de conjuntos de itens guia, você pode filtrar o visualizador para exibir apenas os conjuntos de itens que contêm um tamanho de conjunto de itens e suporte mínimo especificado.

Se você estiver trabalhando com um modelo de mineração diferente e se nenhum conjunto de itens estiver listado, isso quer dizer que nenhum conjunto de itens atendeu aos critérios dos parâmetros do algoritmo. Nesse cenário, você poderá alterar os parâmetros do algoritmo para permitir que conjuntos de itens tenham um suporte inferior.

Para filtrar os conjuntos de itens mostrados no visualizador por nome

  1. Clique o conjuntos de itens Guia do visualizador.

  2. No Filtrar conjunto de itens digite pneu, e clique fora da caixa.

    O filtro retornará todos os itens que contêm essa cadeia de caracteres.

  3. No Mostrar lista, selecione Mostrar apenas nome de atributo.

  4. Selecione o Mostrar nome longo caixa de seleção.

    A lista de conjuntos de itens é atualizada para mostrar somente os conjuntos de itens que contêm a cadeia de caracteres Pneu de Passeio. O nome longo do conjunto de itens inclui o nome da tabela que contém o atributo e o valor de cada item.

  5. Limpar o Mostrar nome longo caixa de seleção.

    A lista de conjuntos de itens é atualizada para mostrar somente o nome curto.

Os valores de suporte coluna indica o número de transações para cada conjunto de itens. Uma transação para um conjunto de itens significa uma compra que incluiu todos os itens do conjunto de itens.

Por padrão, o visualizador lista os conjuntos de itens na ordem decrescente por suporte. Você pode clicar nos cabeçalhos das colunas para classificar por uma coluna diferente, como o tamanho ou o nome do conjunto de itens. Se você estiver interessado em aprender mais sobre as transações individuais incluídas em um conjunto de itens, poderá detalhar a partir dos conjuntos de itens para os casos individuais. As colunas de estrutura dos resultados do detalhamento são o nível de renda do cliente e a ID do cliente, que não foram usados no modelo.

Para exibir detalhes de um conjunto de itens.

  1. Na lista de conjuntos de itens, clique o itens título de coluna para classificar por nome.

  2. Localize o item pneu (com sem um segundo item).

  3. Clique com o botão direito pneu, selecione Detalhar, e, em seguida, selecione colunas do modelo e estrutura.

    O Detalhar caixa de diálogo exibe as transações individuais usadas como suporte para esse conjunto de itens.

  4. Expanda a tabela aninhada, vAssocSeqLineItems, para exibir a lista real de compras da transação.

Para filtrar conjuntos de itens por suporte ou tamanho

  1. Limpe qualquer texto que pode estar no Filtrar conjunto de itens caixa. Não é possível usar um filtro de texto junto com um filtro numérico.

  2. Na suporte mínimo caixa, digite 100 e, em seguida, clique em plano de fundo do visualizador.

    A lista de conjuntos de itens é atualizada para mostrar somente os conjuntos de itens com suporte de pelo menos 100.

Voltar ao Início

Guia Regras

O regras guia exibe as seguintes informações relacionadas às regras que o algoritmo encontra.

  • **Probabilidade:**a probabilidade de uma regra, definida como a probabilidade do item do lado direito dado o item do lado esquerdo.

  • **Importância:**uma medida da utilidade de uma regra. Um valor maior significa uma regra melhor.

    A importância é oferecida para ajudar você a medir a utilidade de uma regra, pois a probabilidade apresentada de forma isolada pode ser falsa. Por exemplo, se todas as transações contiverem uma garrafa d'água -- talvez a garrafa d'água seja adicionada a cada carrinho automaticamente como parte de uma promoção -- o modelo criaria uma regra prevendo que a garrafa d'água teria uma probabilidade 1. Baseada somente na probabilidade, essa regra é bastante precisa, mas não oferece informações úteis.

  • **Regra:**a definição da regra. Para um modelo de cesta básica, uma regra descreve uma combinação específica de itens.

Cada regra pode ser usada para prever a presença de um item em uma transação com base na presença de outros itens. Assim como no conjuntos de itens guia, você pode filtrar as regras para que somente as regras mais interessantes são mostradas. Se você estiver trabalhando com um modelo de mineração que não tenha regras, talvez queira alterar os parâmetros do algoritmo para diminuir o limite de probabilidade para regras.

Para ver somente as regras que incluem a bicicleta Mountain-200

  1. No Visualizador do modelo de mineração clique o regras guia.

  2. Na regra de filtro de digite Mountain-200.

    Limpar o Mostrar nome longo caixa de seleção.

  3. Do Mostrar lista, selecione Mostrar apenas nome de atributo.

    O visualizador exibirá somente as regras que contêm as palavras "Mountain-200". A probabilidade da regra informa a probabilidade é que quando alguém comprasse um Mountain-200 bicicleta, essa pessoa também irá comprar o outro produto listado.

As regras são classificadas por probabilidade em ordem decrescente, mas você pode clicar nos títulos de coluna para alterar a ordem de classificação. Se você estiver interessado em descobrir mais detalhes sobre uma determinada regra, poderá usar o detalhamento para exibir os casos de suporte.

Para exibir casos que dão suporte a uma determinada regra

  1. No regras guia, clique na regra que você deseja exibir.

  2. Selecione Detalhar, e, em seguida, selecione colunas do modelo somente, ou colunas do modelo e estrutura.

    O Detalhar caixa de diálogo fornece um resumo da regra na parte superior do painel e uma lista de todos os casos que foram usados como dados de suporte para a regra.

Voltar ao Início

Visualizador de árvore de conteúdo genérica

Esse visualizador pode ser usado em todos os modelos, independentemente do algoritmo ou do tipo de modelo. O Microsoft genérico conteúdo Visualizador de árvore está disponível a partir de Visualizador lista suspensa.

Uma árvore de conteúdo é uma representação de um modelo de mineração como uma série de nós, em que cada nó representa conhecimento adquirido sobre alguns subconjuntos de dados. O nó pode conter um padrão, um conjunto de regras, um cluster ou a definição de um intervalo de datas que compartilham características semelhantes. O conteúdo exato do nó difere segundo o algoritmo e o tipo do atributo previsível; no entanto, a representação geral do conteúdo é a mesma. É possível expandir os nós para consultar um maior número de detalhes, assim como copiar o conteúdo de qualquer um deles para a Área de Transferência.

Para exibir detalhes sobre a regra usando o visualizador de conteúdo

  1. No Visualizador do modelo de mineração Selecione Microsoft genérico conteúdo Visualizador de árvore do Visualizador lista.

  2. No painel Legenda de Nó, navegue até a parte inferior da lista e clique no último nó.

    O visualizador mostra conjuntos de itens primeiro e regras em seguida, mas não os agrupa. O modo mais fácil de localizar um nó específico é criar uma consulta de conteúdo. Para obter mais informações, consulte Exemplos de consulta de um modelo associação.

  3. No painel Detalhes do Nó, revise o valor de NODE_TYPE e NODE_DESCRIPTION.

    Um tipo de nó 8 é uma regra e um tipo de nó 7 é um conjunto de itens. Para uma regra, o valor de NODE_DESCRIPTION mostra as condições que compõem a regra. Para conjunto de itens, o valor de NODE_DESCRIPTION mostra os itens incluídos no conjunto de itens.

Você também pode criar uma consulta de conteúdo para obter estatísticas detalhadas sobre as regras. Para obter mais informações sobre o conteúdo do modelo de mineração e como interpretá-las, consulte conteúdo do modelo de mineração para modelos de associação e 40; Analysis Services – Data Mining e 41;.

Voltar ao Início

Próxima tarefa da lição

Filtrando uma tabela aninhada em um modelo de mineração e 40; Tutorial de mineração de dados intermediário e 41;

Consulte também

Lição 3: Criando um cenário de cesta de compras (Tutorial intermediário de mineração de dados)
Lição 4: Criando um cenário de Clustering de sequência e 40; Tutorial de mineração de dados intermediário e 41;
Algoritmo Associação da Microsoft
Referência técnica do algoritmo de associação da Microsoft