Descrever o Catálogo de Dados do Microsoft Purview

Concluído

O objetivo do Catálogo de Dados do Microsoft Purview é fornecer uma plataforma para governança de dados e impulsionar a criação de valor empresarial em sua organização. Ele faz isso por meio de um conjunto avançado de recursos que se alinham aos princípios de governança de dados. As seções a seguir descrevem alguns dos principais recursos do Catálogo de Dados do Microsoft Purview.

Domínios de governança

Domínios de governança: Os domínios de governança são uma nova maneira de organizar seu patrimônio de dados por meio de conceitos de negócios, como Marketing ou Finanças, fornecendo contexto para seus ativos de dados. Um domínio de governança é um limite que permite a governança, a propriedade e a descoberta comuns de produtos de dados e conceitos de negócios, como termos de glossário, OKRs ou dados críticos. Você pode estabelecer muitos tipos de limites, como:

  • Áreas fundamentais de negócios: recursos humanos, vendas, finanças, cadeia de fornecedores etc.
  • Áreas de assunto abrangentes: produto, parceiros comerciais etc.
  • Limites baseados em funções organizacionais: experiência do cliente, cadeia de fornecedores de nuvem, business intelligence etc.

Os domínios empresariais estão conectados a vários outros conceitos de negócios que são incorporados como recursos do Catálogo de Dados.

Produtos de dados

Relacionados aos domínios empresariais estão os produtos de dados. Um produto de dados é um constructo de negócios com um nome, descrição, proprietários e, mais importante, uma lista de ativos de dados associados. O produto de dados fornece contexto para os ativos incluídos nele e fornece um caso de uso para os consumidores de dados.

Um domínio de governança pode hospedar muitos produtos de dados, mas um produto de dados é gerenciado por um único domínio de governança e pode ser descoberto em muitos domínios.

Um produto de dados bem-sucedido facilita que os consumidores de dados reconheçam dados valiosos usando sua linguagem diária e, ao mesmo tempo, simplifica as responsabilidades de propriedade desses ativos de dados.

Considere o exemplo em que um cientista de dados criou um conjunto de ativos de dados a serem usados por um modelo de dados e a serem usados por outras pessoas. Embora o cientista de dados possa usar o catálogo de dados para adicionar um termo de glossário a todos os ativos de dados relevantes e pode adicionar uma descrição a cada ativo para torná-lo mais relevante na busca de informações semelhantes, ele não garante que um consumidor de dados saiba qual termo de glossário usar ou que o consumidor de dados encontrará todos os ativos de dados. Um produto de dados é adequado a este cenário. O cientista de dados cria um produto de dados que lista todos os ativos usados para criar seu modelo de dados. A descrição fornece um caso de uso completo, com exemplos ou sugestões sobre como usar os dados. O cientista de dados agora é um proprietário de produto de dados e melhorou a experiência de pesquisa do consumidor de dados, ajudando-o a obter tudo o que precisa neste produto de dados.

Termos do glossário

Os termos do glossário fornecem contexto comercial crítico aos seus ativos de dados e também aplicam políticas que determinam como seus dados devem ser gerenciados, controlados e detectáveis para uso.

Os termos do glossário são conceitos individuais que definem os negócios, processos e sistemas usados em uma organização. Eles podem ser aplicados em uma propriedade de dados, relacionados aos ativos de dados e produtos de dados para fornecer contexto de negócios aos seus usuários.

Os termos são criados em domínios de governança para criar um contexto específico para cada parte da sua organização. Por exemplo, vendas e marketing podem usar o mesmo termo para significar coisas diferentes e seus domínios de governança ajudam sua equipe a diferenciar entre esses significados. Depois de criados, os termos são mapeados para produtos de dados, para fornecer contexto para esses produtos de dados e para fornecer governança de dados específica com base no contexto de negócios.

Os termos do glossário fornecem governança de dados com base no contexto de negócios, pois agora contêm políticas. As políticas em um termo de negócios aplicam metas de integridade de negócios, requisitos de governança de dados e termos de uso específicos a qualquer produto de dados ao qual um termo se aplica.

Elementos de dados críticos

Nem todos os elementos de dados têm a mesma importância ou nível de confidencialidade, e dedicar recursos para gerenciar a qualidade de todos os dados indiscriminadamente pode ser impraticável e caro. Os CDEs (elementos de dados críticos) são um agrupamento lógico de informações importantes em seu patrimônio de dados. Esses agrupamentos podem tornar os dados mais fáceis de entender e promover a padronização. As políticas de acesso e regras de qualidade de dados podem ser anexadas a esses elementos para proteger ainda mais informações confidenciais em seu patrimônio de dados.

Por exemplo: Um elemento de dados crítico "ID do cliente" pode mapear "CustID" de uma tabela e "CID" de outra tabela para o mesmo contêiner lógico. Os usuários podem corresponder a esse valor entre ativos de dados para fazer conexões e, quando os produtores de dados criam um novo ativo, podem usar esse elemento como um blueprint para fornecer informações de qualidade no formato correto.

Elementos de dados críticos são criados em domínios de governança e podem ter políticas definidas para gerenciar essas informações importantes.

Ao criar CDEs, as organizações podem alocar recursos estrategicamente, concentrando o esforço de governança em áreas que têm o impacto mais significativo nos negócios.

OKRs

Os OKRs (objetivos e resultados-chave) no Microsoft Purview são objetivos de negócios rastreáveis vinculados a domínios de governança e produtos de dados para enfatizar o valor dos dados de negócios.

Os OKRs vinculam produtos de dados diretamente a objetivos de negócios reais para diminuir a lacuna entre a empresa e o patrimônio de dados. A governança de dados não é apenas uma tarefa de TI ou uma prática recomendada de engenharia, é uma parte essencial da geração de valor.

Políticas de acesso de dados

As políticas de acesso ao catálogo de dados permitem que você gerencie o acesso aos seus produtos de dados e configure um sistema para fornecer acesso aos usuários que o solicitam. Promova a inovação e a flexibilidade em seu patrimônio de dados criando oportunidades de acesso de autoatendimento, mantendo os padrões de segurança e de uso adequado.

Pesquisar e procurar

A descoberta de dados pode ser demorada porque talvez você não saiba onde encontrar os dados que está procurando. A pesquisa permite que os consumidores de dados encontrem facilmente os dados necessários para suas cargas de trabalho de análise ou governança. Pesquisar é ótimo se você sabe o que está procurando, mas há momentos em que os consumidores de dados querem explorar os dados disponíveis para eles. O Catálogo de Dados do Microsoft Purview oferece uma experiência de navegação que permite que os usuários saibam quais dados estão disponíveis por coleção ou percorrendo a hierarquia de cada origem de dados no catálogo.

Gerenciamento de integridade

O gerenciamento de integridade tem recursos para aprimorar sua estratégia e gerenciamento de governança de dados.

Controles de integridade: Os controles de integridade de dados permitem que sua equipe analise e acompanhe seu percurso para realizar a governança de dados monitorando sua integridade de governança e usando os controles de integridade fornecidos para acompanhar seu progresso. Os Controles de Integridade de Dados são ferramentas, medidas e processos específicos implementados para monitorar, manter e melhorar a qualidade, a segurança e a integridade geral dos dados de uma organização.

Os benefícios dos controles de integridade de dados incluem:

  • Qualidade dos dados melhorada: Garante que os dados permaneçam precisos, consistentes e confiáveis para a tomada de decisões.
  • Segurança aprimorada: Protege dados confidenciais contra violações, acesso não autorizado e corrupção.
  • Conformidade regulatória: Ajuda as organizações a aderirem aos padrões legais e do setor para o gerenciamento de dados.
  • Eficiência operacional: Reduz o tempo e os recursos gastos na correção de problemas de dados e garante que os dados estejam prontamente disponíveis e utilizáveis.
  • Mitigação de risco: Previne erros caros e riscos relacionados a dados que podem surgir de um gerenciamento de dados ruim.

Em resumo, os controles de integridade de dados são componentes essenciais de uma estratégia abrangente de governança de dados, ajudando as organizações a manter a integridade, a segurança e a usabilidade de seus ativos de dados.

Ações de integridade: As ações de gerenciamento de integridade oferecem a você e aos usuários as etapas a serem tomadas para melhorar a integridade e a governança dos dados em seu patrimônio de dados. Essas ações correspondem às verificações feitas para calcular a pontuação de controle de integridade de governança de dados de um produto de dados. Realizar essas ações aumenta sua pontuação de integridade e promove um catálogo de dados geral mais utilizável e detectável.

Qualidade dos dados

A Qualidade de Dados do Microsoft Purview é uma solução abrangente que capacita os proprietários de dados e domínio de governança a avaliar e supervisionar a qualidade de seu ecossistema de dados, facilitando ações direcionadas para melhoria.

A Qualidade de Dados oferece aos usuários a capacidade de avaliar a qualidade dos dados usando regras sem código/baixo código, incluindo regras OOB (prontas para uso) e regras geradas por IA. Essas regras são agregadas para fornecer pontuações nos níveis de ativos de dados, produtos de dados e domínios de governança, garantindo visibilidade de ponta a ponta da qualidade dos dados em cada domínio. A Qualidade de Dados do Microsoft Purview também incorpora recursos de criação de perfil de dados habilitados para IA

Usando a Qualidade de Dados do Microsoft Purview, as organizações podem medir, monitorar e aprimorar efetivamente a qualidade de seus ativos de dados.