Adicionando modelos de mineração a uma estrutura (Analysis Services - Mineração de dados)
Enquanto uma estrutura de mineração define o domínio de dados, um modelo de mineração define como os dados desse domínio serão aplicados em um problema específico. Após ter criado uma estrutura de mineração, é possível adicionar vários modelos de mineração à estrutura. Sempre que um modelo é criado, você pode enfocar um problema de negócios diferente. Por exemplo, você pode alterar os parâmetros para usar uma abordagem ligeiramente diferente ou para usar um subconjunto de dados diferente a fim de obter resultados diferentes ou extrair padrões específicos de uma população de destino.
Para obter mais informações:Criando uma nova estrutura de mineração, Assistente de Mineração de Dados (Analysis Services - Mineração de dados), Gerenciando estruturas de mineração no Designer de Mineração de Dados
Criando um novo modelo de mineração
Há duas abordagens para criar modelos de mineração. Você pode definir sua estrutura de mineração e, em seguida, testá-la com modelos diferentes que também usam essa estrutura. Se preferir, crie o modelo desejado e use a estrutura gerada para criar modelos adicionais.
Ao usar o Assistente de Mineração de Dados para criar um novo modelo de mineração, você cria uma estrutura de mineração primeiro. O assistente permite adicionar um modelo de mineração inicial à estrutura e configurar um conjunto de dados de treinamento e teste nessa estrutura. No entanto, não é necessário criar um modelo imediatamente. Se apenas a estrutura for criada, você não precisa tomar uma decisão sobre qual coluna deve ser usada como o atributo previsível ou sobre como usar os dados em um modelo específico. Em vez disso, configure a estrutura de dados geral que deseja usar no futuro e, posteriormente, use o Designer de mineração de dados para adicionar novos modelos de mineração baseados na estrutura.
Se você já souber o tipo de modelo de mineração que deseja criar, crie a estrutura e use o Assistente de Mineração de Dados para adicionar seu primeiro modelo à estrutura de mineração. Você pode adicionar mais modelos à estrutura depois que o assistente for concluído.
Observação |
---|
Em DMX, a instrução CREATE MINING MODEL começa com o modelo de mineração. Desse modo, você define sua escolha de modelo de mineração e o Analysis Services gera a estrutura subjacente automaticamente. Posteriormente, é possível continuar adicionando novos modelos de mineração a essa estrutura usando a instrução ALTER STRUCTURE… ADD MODEL. |
Para obter mais informações:Gerenciando modelos de mineração no Designer de mineração de dados
Definição de um modelo de mineração
- Depois de definir o domínio de dados, informe ao Analysis Services como usar cada coluna dos dados especificando o conteúdo e o uso da coluna. Não é necessário usar cada coluna incluída na estrutura de mineração de dados em seu novo modelo de mineração. Mesmo quando dois modelos se baseiam na mesma estrutura, você pode informar ao Analysis Services para ignorar uma determinada coluna de um modelo. Para obter mais informações, consulte Arquitetura lógica (Analysis Services – Mineração de Dados).
Escolhendo um algoritmo
Ao adicionar um modelo a uma estrutura, é necessário selecionar um algoritmo de mineração de dados a ser usado nesse modelo. Cada algoritmo executa um tipo de análise diferente e alguns têm requisitos diferentes com relação ao número e ao tipo de colunas de dados usadas para entrada ou previsão.
Portanto, dependendo do algoritmo selecionado, algumas colunas de dados incluídas na estrutura de mineração podem ser ignoradas ou talvez seja necessário convertê-las em outro tipo de dados, ou ainda os valores talvez precisem ser removidos. O Assistente de Mineração de Dados alterará alguns valores automaticamente para que o modelo funcione. No entanto, em outros casos, é recomendado corrigir os dados primeiro ou adicionar uma coluna obrigatória, como uma chave de caso.
Em algumas situações, é possível alterar o algoritmo usado em um modelo, mas a maioria das alterações feitas na definição do modelo requer o reprocessamento do modelo e dos dados. Normalmente, sempre que o algoritmo usado em um modelo é alterado, é necessário considerá-lo como um modelo completamente novo que deve ser reprocessado.
Para obter mais informações:Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Especificando o uso da coluna
Depois de selecionar um algoritmo, especifique como o algoritmo deve manipular os dados em sua estrutura. Isso inclui selecionar colunas previsíveis, se o modelo precisar de uma, selecionar colunas para servir como entradas e especificar uma chave de caso ou tabela aninhada. Essas definições de coluna podem variar para cada modelo, mesmo se os modelos usarem os mesmos dados, visto que os requisitos de cada algoritmo são diferentes. Recomendamos que você tente selecionar somente as colunas mais úteis para análise, pois a inclusão de dados desnecessários aumenta o tempo de processamento e pode afetar a qualidade dos resultados. O Assistente de Mineração de Dados inclui um recurso Sugerir opcional que analisa as colunas incluídas na estrutura e recomenda as colunas que fornecem a maioria das informações, usando uma pontuação baseada em entropia.
Para obter mais informações:Colunas do modelo de mineração, Definindo propriedades em um modelo de mineração
Especificando o conteúdo da coluna
- Para algumas colunas, talvez seja necessário especificar o conteúdo da coluna também. Na mineração de dados do SQL Server, a propriedade Tipo de Conteúdo de cada coluna de dados informa como o algoritmo deve processar os dados da coluna. Por exemplo, se seus dados tiverem uma coluna Receita com valores variáveis, você deve especificar que a coluna contém números contínuos definindo o tipo de conteúdo como Contínuo. No entanto, também é possível especificar que os números da coluna Receita sejam agrupados em blocos definindo o tipo de conteúdo como Diferenciado e, opcionalmente, especificando o número exato de blocos. Você pode criar modelos que manipulam colunas de modos diferentes; por exemplo, é possível criar um modelo que agrupa clientes em três faixas etárias e outro modelo que agrupa clientes em 10 faixas etárias.
Para obter mais informações:Tipos de dados (Mineração de Dados), Tipos de conteúdo (mineração de dados)