CRIAR UM MODELO DE MINERAÇÃO (DMX)
Aplica-se a: SQL Server Analysis Services
Cria um novo modelo de mineração e uma nova estrutura de mineração no banco de dados. É possível criar um modelo definindo o novo modelo na instrução ou usando o PMML (Predictive Model Markup Language). Essa segunda opção é apenas para usuários avançados.
A estrutura de mineração recebe o nome anexando "_structure" ao nome do modelo, o que garante que o nome da estrutura seja diferente do nome do modelo.
Para criar um modelo de mineração para uma estrutura de mineração existente, use a instrução ALTER MINING STRUCTURE (DMX).
Sintaxe
CREATE [SESSION] MINING MODEL <model>
(
[(<column definition list>)]
)
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]
CREATE MINING MODEL <model> FROM PMML <xml string>
Argumentos
Modelo
Um nome exclusivo para o modelo.
Lista de definições de coluna
Uma lista de definições de coluna separadas por vírgulas.
algorithm
O nome de um algoritmo de mineração de dados, conforme definido pelo provedor atual.
Observação
Uma lista dos algoritmos compatíveis com o provedor atual pode ser recuperada usando DMSCHEMA_MINING_SERVICES conjunto de linhas. Para exibir os algoritmos com suporte na instância atual do Analysis Services, consulte Propriedades de mineração de dados.
Lista de parâmetros
Opcional. Uma lista separada por vírgulas de parâmetros definidos pelo provedor para o algoritmo.
Cadeia de caracteres XML
(Apenas para uso avançado.) Um modelo codificado em XML (PMML). A cadeia deve estar entre aspas simples (').
A cláusula SESSION permite criar um modelo de mineração que é removido automaticamente do servidor quando a conexão é fechada ou a sessão atinge o tempo limite. Os modelos de mineração SESSION são úteis porque não exigem que o usuário seja um administrador de banco de dados e usam apenas o espaço em disco enquanto a conexão estiver aberta.
A cláusula WITH DRILLTHROUGH permite o detalhamento no novo modelo de mineração. O detalhamento pode ser habilitado somente durante a criação do modelo. Para alguns tipos de modelo, o detalhamento é necessário para procurar o modelo no visualizador personalizado. O detalhamento não é necessário para previsão ou para procurar o modelo usando o Visualizador de Árvore de Conteúdo Genérica da Microsoft.
A instrução CREATE MINING MODEL cria um novo modelo de mineração baseado na lista de definições de coluna, no algoritmo e na lista de parâmetros do algoritmo.
Lista de definições de coluna
Você define a estrutura de um modelo que usa a lista de definições da coluna incluindo as seguintes informações para cada coluna:
Nome (obrigatório)
Tipo de dados (obrigatório)
Distribuição
Lista de sinalizadores de modelagem
Tipo de conteúdo (obrigatório)
Solicitação de previsão, que indica ao algoritmo para prever essa coluna, indicada pela cláusula PREDICT ou PREDICT_ONLY
Relação com uma coluna de atributo (obrigatória somente se aplicável), indicada pela cláusula RELATED TO
Use a seguinte sintaxe para a lista de definição de coluna, para definir uma única coluna:
<column name> <data type> [<Distribution>] [<Modeling Flags>] <Content Type> [<prediction>] [<column relationship>]
Use a seguinte sintaxe para a lista de definição de coluna para definir uma coluna de tabela aninhada:
<column name> TABLE [<prediction>] ( <non-table column definition list> )
Exceto para os sinalizadores de modelagem, não é possível usar mais de uma cláusula de um grupo específico para definir uma coluna. É possível definir diversos sinalizadores de modelagem para uma coluna.
Para obter uma lista dos tipos de dados, dos tipos de conteúdo, de distribuições de coluna e de sinalizadores de modelagem que podem ser usados para definir uma coluna, consulte os seguintes tópicos:
É possível adicionar uma cláusula a instrução para descrever a relação entre duas colunas. O Analysis Services dá suporte ao uso da seguinte <cláusula de relação> de coluna.
RELACIONADOS A
Este formulário indica uma hierarquia de valor. O destino de uma coluna RELATED TO pode ser a coluna de chave em uma tabela aninhada, uma coluna com um valor discreto na linha de caso ou outra coluna com uma cláusula RELATED TO, que indica uma hierarquia mais profunda.
Use uma cláusula de previsão para descrever como a coluna de previsão é usada. A seguinte tabela descreve as duas possíveis cláusulas.
<> cláusula de previsão | Descrição |
---|---|
PREDICT | Esta coluna pode ser prevista pelo modelo e pode ser fornecida em casos de entrada para prever o valor de outras colunas de previsão. |
PREDICT_ONLY | Esta coluna pode ser prevista pelo modelo, mas seus valores não podem ser usados em casos de entrada para prever o valor de outras colunas de previsão. |
Lista de definições de parâmetro
Você pode usar a lista de parâmetros para ajustar o desempenho e a funcionalidade de um modelo de mineração. A sintaxe da lista de parâmetros é a seguinte:
[<parameter> = <value>, <parameter> = <value>,...]
Para obter uma lista dos parâmetros associados a cada algoritmo, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de dados).
Comentários
Se você desejar criar um modelo que tem um conjunto de dados de teste interno, deverá usar a instrução CREATE MINING STRUCTURE seguida por ALTER MINING STRUCTURE. No entanto nem todos os tipos de modelo oferecem suporte a um conjunto de dados de validação. Para obter mais informações, consulte CREATE MINING STRUCTURE (DMX).
Para obter um passo a passo de como criar um modelo de mineração usando a instrução CREATEMODEL, consulte Tutorial DMX de previsão de série temporal.
Exemplo de Naive Bayes
O exemplo a seguir usa o algoritmo Naive Bayes da Microsoft para criar um novo modelo de mineração. A coluna Bike Buyer está definida como o atributo previsível.
CREATE MINING MODEL [NBSample]
(
CustomerKey LONG KEY,
Gender TEXT DISCRETE,
[Number Cars Owned] LONG DISCRETE,
[Bike Buyer] LONG DISCRETE PREDICT
)
USING Microsoft_Naive_Bayes
Exemplo de modelo de associação
O exemplo a seguir usa o algoritmo Associação da Microsoft para criar um novo modelo de mineração. A instrução aproveita a capacidade de aninhar uma tabela dentro da definição do modelo usando uma coluna de tabelas. O modelo é modificado usando os parâmetros MINIMUM_PROBABILITY e MINIMUM_SUPPORT .
CREATE MINING MODEL MyAssociationModel (
OrderNumber TEXT KEY,
[Products] TABLE PREDICT (
[Model] TEXT KEY
)
)
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)
Exemplo de cluster de sequência
O exemplo a seguir usa o algoritmo Microsoft Sequence Clustering para criar um novo modelo de mineração. Duas chaves são usadas para definir o modelo. A coluna OrderNumber é usada como a chave do caso e especifica pedidos individuais. A coluna LineNumber é usada como a chave de tabela aninhada e especifica a sequência na qual os itens foram adicionados a um pedido.
CREATE MINING MODEL BuyingSequence (
[Order Number] TEXT KEY,
[Products] TABLE
(
[Line Number] LONG KEY SEQUENCE,
[Model] TEXT DISCRETE PREDICT
)
)
USING Microsoft_Sequence_Clustering
Exemplo de série temporal
O exemplo a seguir usa o algoritmo Microsoft Times Series para criar um novo modelo de mineração usando o algoritmo ARTxp. ReportingDate é a coluna de chave para a série temporal e ModelRegion é a coluna de chave para a série de dados. Neste exemplo, presume-se que a periodicidade dos dados é a cada 12 meses. Portanto, o parâmetro PERIODICITY_HINT é definido como 12.
Observação
Você deve especificar o parâmetro PERIODICITY_HINT usando caracteres de chave. Além disso, como o valor é uma cadeia de caracteres, ele deve ser colocado entre aspas simples: "{<valor> numérico}".
CREATE MINING MODEL SalesForecast (
ReportingDate DATE KEY TIME,
ModelRegion TEXT KEY,
Amount LONG CONTINUOUS PREDICT,
Quantity LONG CONTINUOUS PREDICT
)
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')
Confira também
Instruções de definição de dados DMX (Data Mining Extensions)
Instruções de manipulação de dados DMX (Data Mining Extensions)
Referência de instrução DMX (Data Mining Extensions)