Usando Integration Services com mineração de dados
A mineração de dados freqüentemente é descrita como o processo de extração de informações válidas e acionáveis de bancos de dados grandes. Em outras palavras, a mineração de dados ajuda você a descobrir padrões e tendências que existam nos dados. O Microsoft SQL ServerAnalysis Services oferece capacidades de mineração de dados e ferramentas poderosas para extrair e analisar esses padrões. O Integration Services oferece uma variedade de componentes para ajudar você a gerenciar e consultar esses modelos de mineração de dados.
Para obter mais informações sobre os recursos de mineração de dados no SQL ServerAnalysis Services, consulte Visão Geral (Analysis Services - Mineração de Dados) e Projetos de mineração de dados (Analysis Services – Mineração de Dados).
Observação |
---|
Alguns dos componentes do Integration Services descritos neste tópico só estão disponíveis no SQL Server Enterprise Edition e Developer Edition. |
Gerenciadores de conexões
Um gerenciador de conexões é uma representação lógica de uma conexão com uma fonte de dados. Você pode usar o gerenciador de conexões do Analysis Services para conectar-se a um banco de dados do Analysis Services no qual estejam armazenados modelos e estruturas de mineração. Todas as tarefas e componentes de fluxo de dados descritos neste tópico requerem um gerenciador de conexões do Analysis Services.
Gerenciador de conexões do Analysis Services
Um gerenciador de conexões do Analysis Services habilita um pacote a conectar-se a um servidor que execute um banco de dados do Analysis Services ou a um projeto do Analysis Services que forneça acesso a estruturas de mineração e modelos. Você só pode conectar-se a um projeto do Analysis Services enquanto estiver desenvolvendo pacotes no Business Intelligence Development Studio. No tempo de execução, os pacotes conectam-se ao servidor e ao banco de dados para os quais você implantou o Analysis Services.
Para obter mais informações, consulte Gerenciador de conexões do Analysis Services.
Tarefas
Tarefas são elementos de fluxo de controle que definem unidades de trabalho que são executadas em um pacote. Você pode usar as tarefas a seguir para criar ou modificar uma estrutura de mineração de dados ou modelo e para processar ou consultar um modelo.
Tarefa Executar DDL do Analysis Services
A tarefa Executar DLL do Analysis Services executa instruções DLL (data definition language) que podem criar, descartar ou alterar estruturas de mineração e modelos. As instruções DDL são representadas como instruções em ASSL (Analysis Services Scripting Language) e são enquadradas em um comando XMLA (XML for Analysis).
Para obter mais informações sobre essa tarefa, consulte Tarefa Executar DDL do Analysis Services. Para obter mais informações sobre como criar e alterar objetos do Analysis Services usando XMLA, consulte Criando e alterando objetos (XMLA).
Tarefa Processamento do Analysis Services
A tarefa processamento do Analysis Services automatiza o processamento de objetos do Analysis Services, como modelos de mineração.
Para obter mais informações sobre essa tarefa, consulte Tarefa Processamento do Analysis Services. Para obter mais informações sobre como processar objetos do Analysis Services, consulte Processando objetos do Analysis Services.
Tarefa Consulta de mineração de dados
A tarefa consulta de mineração de dados executa consultas de previsão com base em modelos internos de mineração de dados do Analysis Services. A consulta de previsão cria uma previsão para novos dados usando modelos de mineração e salva seu resultado em uma ou mais tabelas.
Para obter mais informações sobre essa tarefa, consulte Tarefa Consulta de Mineração de Dados. Para obter mais informações sobre consultas a um modelo de mineração de dados usando DMX, consulte Criando consultas de previsão DMX.
Transformações de fluxo de dados
Transformações são os componentes no fluxo de dados de um pacote que agregam, mesclam, distribuem e modificam dados.
Transformação Consulta de Mineração de Dados
A transformação Consulta de Mineração de Dados executa consultas de previsão em relação a modelos de mineração de dados. Essa transformação contém um construtor de consultas para criar consultas de DMX (Data Mining Extensions). O construtor de consultas permite que você crie instruções personalizadas, usando a linguagem DMX, para avaliar os dados de entrada de transformação em relação a um modelo de mineração existente. Ao contrário da tarefa de consulta de mineração de dados que salva seu resultado diretamente em uma ou mais tabelas, a transformação Consulta de Mineração de Dados disponibiliza seu resultado para os componentes downstream no fluxo de dados do pacote.
Para obter mais informações sobre essa transformação, consulte Transformação Consulta de Mineração de Dados. Para obter mais informações sobre consultas a um modelo de mineração de dados usando DMX, consulte Criando consultas de previsão DMX.
Destinos de fluxo de dados
Destinos são os componentes de fluxo de dados que carregam a saída de um fluxo de dados em diferentes tipos de fontes de dados ou criam um conjunto de dados na memória.
Destino de treinamento de modelos de mineração de dados
Um destino de treinamento de modelos de mineração de dados treina modelos de mineração de dados ao passar os dados que o destino recebe pelos algoritmos de modelo de mineração de dados. Durante o processo de treinamento, os algoritmos calculam os padrões e relações entre elementos nos dados. Depois de treinar um modelo de mineração novo, você pode usá-lo para executar consultas de previsão.
Para obter mais informações, consulte Destino de treinamento do modelo de mineração de dados.
Outros componentes do Integration Services para mineração de dados
O Integration Services tem muitos outros componentes que podem ser úteis como parte de uma solução de mineração de dados.
Para treinar ou testar seus modelos de mineração de dados com um subconjunto de seus dados, é possível usar:
**Transformação Amostragem de Linhas. **Copia só um subconjunto de linhas baseado em uma conta que você especifica. Para obter mais informações, consulte Transformação Amostragem de Linhas.
**Transformação Amostragem Porcentual. **Copia só um subconjunto de linhas baseado em um percentual que você especifica. Para obter mais informações, consulte Transformação Amostragem Percentual.
Para limpar os dados removendo duplicatas e unificando valores, você pode usar:
**Transformação Classificação. **Remove linhas duplicadas enquanto classifica os dados. Para obter mais informações, consulte Transformação Classificação.
**Transformação Agrupamento Difuso. **Agrupa linhas com base na semelhança em vez de na correspondência exata. Para obter mais informações, consulte Transformação Agrupamento Difuso e Como identificar linhas de dados similares usando a transformação Agrupamento Difuso.
**Transformação Pesquisa Difusa. **Localiza uma correspondência em uma tabela de referência com base na semelhança em vez de na correspondência exata. Para obter mais informações, consulte Transformação Pesquisa Difusa.
Para executar mineração de texto, você pode usar:
**Transformação Extração de Termos. **Cria uma tabela dos termos descobertos na origem, depois de filtrar palavras padrão e de ruído definidas pelo usuário. Para obter mais informações, consulte Transformação Extração de Termos.
**Transformação Pesquisa de Termos. **Faz a correspondência de termos de sua entrada com termos de uma tabela de referência. Para obter mais informações, consulte Transformação Pesquisa de Termo.
|
Consulte também