Classes de mineração de dados AMO
As classes de mineração de dados ajudam você a criar, modificar, excluir e processar objetos de mineração de dados. O trabalho com objetos de mineração de dados inclui a criação de estruturas de mineração de dados, a criação de modelos de mineração de dados e o processamento dos modelos.
Para obter mais informações sobre como configurar o ambiente e sobre os objetos Server, Database, DataSourceDataSourceView, consulte Classes fundamentais AMO.
A definição de objetos no AMO (Objetos de Gerenciamento de Análise) exige a definição de várias propriedades em cada objeto para a configuração do contexto correto. Os objetos complexos, como os objetos OLAP e de mineração de dados, exigem uma codificação longa e detalhada.
Este tópico contém as seguintes seções:
Objetos MiningStructure
Objetos MiningModel
A ilustração a seguir mostra o relacionamento das classes explicadas neste tópico.
Objetos MiningStructure
Uma estrutura de mineração é o contêiner para modelos de mineração. A estrutura define todas as colunas possíveis que os modelos de mineração podem usar. Cada modelo de mineração define suas próprias colunas a partir do conjunto de colunas definidas na estrutura.
Um objeto simples MiningStructure é composto de: informações básicas, uma exibição da fonte de dados, um ou mais ScalarMiningStructureColumn, nenhum ou mais TableMiningStructureColumn e um MiningModelCollection.
As informações básicas incluem o nome e o ID (identificador interno) do objeto MiningStructure.
O objeto DataSourceView armazena o modelo de dados subjacente para a estrutura de mineração.
ScalarMiningStructureColumn são colunas ou atributos com valores únicos.
TableMiningStructureColumn são colunas ou atributos com diversos valores para cada caso.
MiningModelCollection contém todos os modelos de mineração criados a partir dos mesmos dados.
Um objeto MiningStructure é criado ao ser adicionado a MiningStructureCollection do banco de dados e pela atualização do objeto de MiningStructure no servidor por meio do método Update.
Para remover um objeto MiningStructure, ele deverá ser descartado por meio do método Drop do objeto MiningStructure. A remoção de um objeto MiningStructure da coleção não afetará o servidor.
MiningStructure pode ser processado por seu próprio método de acesso, ou pode ser processado quando um objeto pai processa a si mesmo usando seu próprio método de processamento.
Colunas
As colunas armazenam os dados para o modelo e podem ser de tipos diferentes, dependendo do uso: Key, Input, Predictable ou InputPredictable. As colunas previsíveis são o destino da criação do modelo de mineração.
As colunas de valor único são conhecidas como ScalarMiningStructureColumn no AMO. As colunas de diversos valores são conhecidas como TableMiningStructureColumn.
ScalarMiningStructureColumn
Um objeto simples ScalarMiningStructureColumn é composto de informações básicas, tipo, conteúdo e associação de dados.
As informações básicas incluem o nome e o ID (identificador interno) de ScalarMiningStructureColumn.
O tipo é o tipo de dados do valor: LONG, BOOLEAN, TEXT, DOUBLE, DATE.
O conteúdo diz ao mecanismo como a coluna pode ser modelada. Os valores podem ser: Discrete, Continuous, Discretized, Ordered, Cyclical, Probability, Variance, StdDev, ProbabilityVariance, ProbabilityStdDev, Support, Key.
A associação de dados é a vinculação da coluna de mineração de dados com o modelo de dados subjacente usando um elemento de exibição da fonte de dados.
Um ScalarMiningStructureColumn é criado ao ser adicionado ao MiningStructureCollection pai e pela atualização do objeto MiningStructure pai no servidor por meio do método Update.
Para remover um ScalarMiningStructureColumn, ele terá de ser removido da coleção do MiningStructure pai e o objeto MiningStructure pai terá de ser atualizado no servidor por meio do método Update.
TableMiningStructureColumn
Um objeto simples TableMiningStructureColumn é composto de informações básicas e de colunas escalares.
As informações básicas incluem o nome e o ID (identificador interno) de TableMiningStructureColumn.
As colunas escalares são ScalarMiningStructureColumn.
Um TableMiningStructureColumn é criado ao ser adicionado à coleção MiningStructure pai e pela atualização do objeto TableMiningStructureColumn pai no servidor por meio do método Update.
Para remover um ScalarMiningStructureColumn, ele terá de ser removido da coleção do MiningStructure pai e o objeto MiningStructure pai terá de ser atualizado no servidor por meio do método Update.
Objetos MiningModel
Um MiningModel é o objeto que permite a você escolher que colunas da estrutura serão usadas, quais serão os algoritmos usados e, opcionalmente, especificar parâmetros para ajustar o modelo. Por exemplo, talvez você queira definir vários modelos de mineração na mesma estrutura de mineração que usa os mesmos algoritmos, mas para ignorar algumas colunas da estrutura de mineração de um modelo, use-as como entradas em outro modelo e use-as como entrada e faça a previsão de um terceiro modelo. Isso pode ser útil se você quiser tratar uma coluna como contínua em um modelo de mineração, mas como diferenciada em outro.
Um objeto simples MiningModel é composto de: informações básicas, definição de algoritmo e colunas.
As informações básicas incluem o nome e o ID (identificador interno) do modelo de mineração.
Uma definição de algoritmo se refere a qualquer um dos algoritmos padrão fornecidos pelo Analysis Services ou a qualquer algoritmo personalizado habilitado no servidor.
As colunas são uma coleção das colunas usadas pelo algoritmo e sua definição de uso.
Um MiningModel é criado ao ser adicionado a MiningModelCollection do banco de dados e pela atualização do objeto de MiningModel no servidor por meio do método Update.
Para remover um MiningModel, ele terá de ser descartado por meio do método Drop de MiningModel. A remoção de um MiningModel da coleção não afetará o servidor.
Depois de criado, um MiningModel poderá ser processado por meio de seu próprio método de processamento, ou poderá ser processado quando um objeto pai processar a si mesmo com seu próprio método de processamento.