Conceitos do Data Quality Services
Aplica-se a: SQL Server
Este tópico fornece um breve resumo de conceitos do Data Quality Services (DQS) em gerenciamento do conhecimento, projetos de qualidade de dados e administração de qualidade de dados.
Conceitos de gerenciamento de conhecimento
A base de dados de conhecimento do DQS é um repositório de metadados que são criados pelo administrador de dados ou pelo profissional de TI a fim de melhorar a qualidade de dados através da limpeza e da correspondência de dados. O gerenciamento de conhecimento do DQS inclui os processos usados para criar e gerenciar a base de conhecimento, de forma assistida por computador e interativamente.
Descoberta da Base de Dados de Conhecimento
A descoberta de conhecimento é um processo assistido por computador que analisa exemplos dos dados de sua organização para criar conhecimento sobre os dados. Quando você tem os resultados da análise, pode validar e aprimorar o conhecimento e, depois, aplicá-lo à execução de limpeza, correspondência e criação de perfil de dados. Para obter mais informações, consulte DQS Knowledge Bases and Domains.
Gerenciamento de Domínio
O processo de gerenciamento de domínio lhe permite alterar ou aumentar o conhecimento gerado pelo processo de descoberta de conhecimento. Você pode editar, atualizar e revisar interativamente o conhecimento em uma base de dados de conhecimento. Uma base de dados de conhecimento consiste em domínios de dados que contêm valores de domínio e seu status, regras de domínio, relações baseadas em termos e dados de referência. No gerenciamento de domínio, você pode alterar propriedades de domínio, anexar dados de referência a um domínio, gerenciar regras de domínio, gerenciar valores de domínio e inserir relações de dados, além de criar, excluir, importar ou exportar domínios. Você também pode usar domínios compostos que agregam mais de um domínio único. Para obter mais informações, consulte DQS Knowledge Bases and Domains.
Política de Correspondência
Uma política de correspondência contém as regras de correspondência usadas para executar a eliminação de duplicação de dados. O processo de política de correspondência permite a você criar regras de correspondência, ajustá-las com base nos resultados correspondentes e na criação de perfis de dados, além de adicionar a política à base de dados de conhecimento. Para obter mais informações, consulte Data Matching.
Serviços de Dados de Referência
Você pode usar dados de referência para validar, corrigir e enriquecer seus dados, aproveitando os serviços de empresas que garantem a qualidade dos seus dados de referência. Você pode usar os serviços do Azure Marketplace para se conectar a provedores de dados de referência ou pode usar uma conexão direta a um provedor. Para obter mais informações, consulte Reference Data Services in DQS.
Para obter mais informações sobre o gerenciamento de conhecimento no DQS, consulte DQS Knowledge Bases and Domains.
Conceitos de projeto de qualidade de dados
O administrador de dados executa operações de qualidade de dados (limpeza e correspondência) usando um projeto de qualidade de dados no aplicativo do Data Quality Client.
Limpeza de dados
A limpeza de dados no DQS é feita com base no conhecimento em uma base de dados de conhecimento do DQS. A limpeza de dados no DQS é um processo de duas etapas:
Limpeza auxiliada por computador: o DQS usa o conhecimento na base de dados de conhecimento selecionada para o projeto de limpeza para propor correções/sugestões aos valores em uma fonte de dados.
Limpeza interativa: o administrador de dados pode executar o processo de limpeza interativo para alterar ou aumentar correções de dados que foram propostas pelo processo de limpeza de dados assistida por computador. O administrador de dados faz isso usando níveis de confiança e estatísticas identificadas pelo processo de limpeza de dados, ou inserindo manualmente suas próprias alterações no projeto.
Depois de limpar dados, o administrador de dados pode exportar os dados processados para um banco de dados do SQL Server, .csv ou um arquivo do Excel. Para obter mais informações, consulte Data Cleansing.
Correspondência de dados
O processo de correspondência permite ao administrador de dados comparar dados de forma que dados semelhantes, mas com ligeiras diferenças, possam ser alinhados através de um processo de eliminação de duplicação. O DQS executa a eliminação de duplicação com base em regras de correspondência contidas na base de dados de conhecimento; o administrador de dados especifica parâmetros para o processo de correspondência dentro de um projeto de qualidade de dados. Para obter mais informações, consulte Data Matching.
Criação de perfis e notificações
A criação de perfil de dados fornece aos administradores de dados estatísticas em tempo real e informações sobre os dados que estão sendo processados pelo DQS para as atividades de limpeza e correspondência enquanto executa um projeto de qualidade de dados. A criação de perfil de dados ajuda a avaliar a efetividade das atividades de limpeza e correspondência em um projeto de qualidade de dados, e as notificações ajudam o usuário com ações que podem ser realizadas para aprimorar as atividades de limpeza de dados e correspondência de dados. Para obter mais informações, consulte Data Profiling and Notifications in DQS.
Para obter mais informações sobre projetos de qualidade de dados no DQS, consulte Projetos de qualidade de dados (DQS).
Conceitos de administração do Data Quality
Um administrador de DQS pode executar diversas tarefas administrativas usando o aplicativo Data Quality Client.
Monitoramento de Atividades
O monitoramento de atividades exibe o status e o estado de cada atividade executada em um intervalo de dados, fornece dados para cada atividade e permite que os administradores do DQS controlem uma atividade. Para obter mais informações, consulte Monitor DQS Activities.
Configuration
A opção de Configuração permite que você:
Defina configurações de serviço de dados de referência. Para obter mais informações, consulte Configure DQS to Use Reference Data.
Defina os valores de limites para atividades de limpeza e correspondência. Para obter mais informações, consulte Configurar valores de limite para limpeza e correspondência.
Habilitar/desabilitar notificações de criação de perfil. Para obter mais informações, consulte Habilitar ou desabilitar notificações de criação de perfil no DQS.
Configure níveis de severidade para os arquivos de log do DQS no nível baseado em atividade ou no nível mais avançado baseado em módulo. Para obter mais informações, consulte Configure Severity Levels for DQS Log Files.
Segurança do DQS
Você usa funções do mecanismo de segurança do SQL Server para tornar o DQS seguro. Há três funções de DQS que determinam o nível de acesso para um usuário no aplicativo Data Quality Client: dqs_administrator, dqs_kb_editor e dqs_kb_operator. Você não pode conceder funções aos usuários usando o aplicativo Data Quality Client; isso é feito usando o SQL Server Management Studio. Para obter mais informações, consulte DQS Security.
Para obter mais informações sobre a administração do DQS, consulte DQS Administration.