Tutorial de DMX do Market Basket

Nesse tutorial, você aprenderá como criar, treinar e explorar modelos de mineração de dados, utilizando a linguagem de consulta das DMX (Extensões de Mineração de Dados). Você então utilizará esses modelos de mineração de dados para criar previsões que descrevem quais produtos tendem a ser adquiridos ao mesmo tempo.

Os modelos de mineração serão criados a partir dos dados contidos no banco de dados de amostra AdventureWorksDW2008R2, que armazena dados da empresa fictícia Ciclos da Adventure Works. Ciclos da Adventure Works é uma grande indústria multinacional. A empresa fabrica e vende bicicletas de metal e compostas para os mercados norte-americano, europeu e asiático. Suas operações principais estão situadas em Bothell, Washington, com 290 funcionários, e tem várias equipes regionais de vendas distribuídas por toda a sua base de mercado internacional.

Cenário do tutorial

Ciclos da Adventure Works decidiu criar um aplicativo personalizado que utilize a funcionalidade de mineração de dados para prever que tipos de produtos seus clientes tendem a comprar ao mesmo tempo. O objetivo do aplicativo personalizado é ser capaz de especificar um conjunto de produtos e prever que produtos adicionais serão comprados com os produtos especificados. Ciclos da Adventure Works utilizará essas informações para adicionar um recurso de “sugestão” ao site e também para organizar melhor a forma como ele apresenta informações para os clientes.

Microsoft SQL Server Analysis Services fornece várias ferramentas que podem ser usadas para realizar esta tarefa:

DMX (Extensões de Mineração de Dados) é uma linguagem de consulta fornecida por Analysis Services que pode ser usada para criar e trabalhar com modelos de mineração. O algoritmo de Associação Microsoft cria modelos que podem predizer os produtos que provável serão comprados junto.

O objetivo deste tutorial é fornecer as consultas DMX que serão usadas no aplicativo personalizado.

Para obter mais informações:, Projetos de mineração de dados (Analysis Services - Mineração de Dados)

Estrutura de mineração e modelos de mineração

Antes de começar a criar instruções DMX, é importante compreender os objetos principais que o Analysis Services usa para criar modelos de mineração. A estrutura de mineração é uma estrutura de dados que define o domínio de dados do qual modelos de mineração são criados. Uma única estrutura de mineração pode conter vários modelos de mineração que compartilham o mesmo domínio. Um modelo de mineração aplica um algoritmo de modelo de mineração aos dados que são representados por uma estrutura de mineração.

Os blocos de construção da estrutura de mineração são as colunas da estrutura de mineração, que descrevem os dados que a fonte de dados contém. Essas colunas contêm informações como tipo de dados, tipo de conteúdo e como os dados são distribuídos.

Os modelos de mineração devem conter a coluna chave descrita na estrutura de mineração, bem como um subconjunto das colunas restantes. O modelo de mineração define o uso para cada coluna e define o algoritmo que é utilizado para criar o modelo de mineração. Por exemplo, em DMX você pode especificar que uma coluna é uma coluna Chave ou uma coluna PREDICT. Se uma coluna não for especificada, será assumido que é uma coluna de entrada.

Em DMX, há dois modos para criar modelos de mineração. Você pode criar a estrutura de mineração e o modelo de mineração associado juntos utilizando a instrução CREATE MINING MODEL, ou pode criar primeiro uma estrutura de mineração utilizando a instrução CREATE MINING STRUCTURE e, em seguida, adicionar um modelo de mineração à estrutura utilizando a instrução ALTER STRUCTURE. Estes métodos são descritos abaixo.

  • CREATE MINING MODEL
    Use esta instrução para criar juntos uma estrutura de mineração e um modelo de mineração associado que usa o mesmo nome. O nome de modelo de mineração é acrescentado com "Structure" para diferenciá-lo da estrutura de mineração.

    Esta instrução será útil se você estiver criando uma estrutura de mineração que conterá um único modelo de mineração.

    Para obter mais informações, consulte CRIAR UM MODELO DE MINERAÇÃO (DMX).

  • CRIAR UMA ESTRUTURA DE MINERAÇÃO
    Use essa declaração para criar uma nova estrutura de mineração sem-modelos.

    Ao usar CREATE MINING STRUCTURE, você também poderá criar um conjunto de dados de validação que poderá ser usado para teste de modelos baseados na mesma estrutura de mineração.

    Para obter mais informações, consulte CRIAR UMA ESTRUTURA DE MINERAÇÃO (DMX).

  • ALTER MINING STRUCTURE
    Use esta instrução para acrescentar um modelo de mineração a uma estrutura de mineração que já existe no servidor.

    Há várias razões pelas quais você deseja adicionar mais de um modelo de mineração em uma única estrutura de mineração. Por exemplo, você poderia criar vários modelos de mineração utilizando algoritmos diferentes para ver qual trabalha melhor. Como alternativa, você poderia criar vários modelos de mineração usando o mesmo algoritmo, mas com um conjunto de parâmetros definido de modo diferente para cada modelo de mineração a fim de encontrar a melhor definição para o parâmetro.

    Para obter mais informações, consulte ALTER MINING STRUCTURE (DMX).

Como você criará uma estrutura que contém vários modelos de mineração, utilizará o método secundário neste tutorial.

Para obter mais informações

Referência DMX (Data Mining Extensions), Compreendendo a instrução Select (DMX), Consultas de previsão (DMX)

O que você aprenderá

Este tutorial se divide nas lições a seguir:

Requisitos

Antes de fazer este tutorial, verifique se os seguintes itens estão instalados:

  • Microsoft SQL Server 

  • Microsoft SQL Server Analysis Services 

  • O banco de dados AdventureWorksDW2008R2

Por padrão, e para reforçar a segurança, os bancos de dados de exemplo não são instalados. Para instalar o banco de dados de exemplo oficial do Microsoft SQL Server, acesse https://www.CodePlex.com/MSFTDBProdSamples ou visite a home page Microsoft SQL Server Samples and Community Projects, na seção Microsoft SQL Server Product Samples. Clique em Bancos de Dados e, em seguida, clique na guia Releases e selecione o banco de dados desejado.

ObservaçãoObservação

Ao examinar os tutoriais, recomendamos adicionar os botões Próximo Tópico e Tópico Anterior à barra de ferramentas do visualizador de documentos. Para obter mais informações, consulte Adicionando os botões Próximo e Anterior à Ajuda.