Visão geral da zona de destino de gerenciamento de dados da análise de escala de nuvem

Artigo
09/30/2024

A zona de destino de gerenciamento de dados é uma função de gerenciamento central para a análise em escala de nuvem. Ela é responsável pela governança de sua plataforma de análise.

A zona de destino de gerenciamento de dados é uma assinatura separada com os serviços padrão de uma zona de destino do Azure. Ela permite a governança dos dados por meio de rastreadores, que se conectam aos data lakes e ao armazenamento poliglota nas zonas de destino de dados. O emparelhamento de rede virtual conecta a zona de destino de gerenciamento de dados às zonas de destino de dados e à assinatura de conectividade.

Use essa arquitetura como um ponto de partida. Baixe o arquivo Visio e modifique-o para ajustá-lo aos seus requisitos técnicos e comerciais específicos ao planejar a implementação da zona de destino de gerenciamento de dados.

Observação

A persistência poliglota é um termo de armazenamento que descreve sua escolha entre diferentes tecnologias de armazenamento de dados/armazenamentos de dados para dar suporte a seus vários tipos de dados e suas necessidades de armazenamento. Essencialmente, a persistência poliglota é o conceito de que um aplicativo pode usar mais de um banco de dados principal ou tecnologia de armazenamento.

Importante

Sua zona de destino de gerenciamento de dados deve ser implantada como uma assinatura separada em um grupo de gerenciamento com a governança apropriada. Assim, é possível controlar a governança em toda a organização. O acelerador de zona de destino do Azure ilustra como abordar essas zonas.

Catálogo de dados

Grupo de recursos: governance-rg

O catálogo de dados registra e mantém as informações dos dados em um local centralizado e as disponibiliza para a organização. Ele garante que as empresas evitem produtos de dados duplicados causados pela ingestão de dados redundantes por diferentes equipes de projeto.

Recomendamos que você crie um serviço de catálogo de dados para definir os metadados dos produtos de dados armazenados nas zonas de destino de dados.

A análise em escala de nuvem depende do Microsoft Purview para registrar fontes de dados corporativas, classificá-las, garantir a qualidade dos dados e oferecer acesso seguro e de autoatendimento.

O Microsoft Purview é um serviço baseado em locatário e pode se comunicar com cada zona de destino de dados criando uma Rede Virtual Gerenciada implantada na região de suas zonas de destino de dados. Você pode implantar o Rede Virtual gerenciada do Microsoft Azure Integration Runtimes (IR) nas Redes Virtuais Gerenciadas do Microsoft Purview em qualquer região disponível do Microsoft Purview. A partir daí, o IR da rede virtual gerenciada pode usar pontos de extremidade privados para se conectar com segurança e verificar as fontes de dados com suporte. Para obter mais informações, consulte Usar a rede virtual gerenciada com sua conta do Microsoft Purview. A criação de uma IR de rede virtual gerenciada na rede virtual gerenciada garante que o processo de integração de dados seja isolado e seguro.

Observação

Embora esta documentação se concentre principalmente no uso do Microsoft Purview para governança, as empresas podem ter investido em outros produtos, como Alation, Okera ou Collibra. Essas soluções são baseadas em assinatura e recomendamos implantá-las na zona de destino de gerenciamento de dados. Esteja ciente de que isso poderá exigir algumas integrações personalizadas.

Para mais informações, consulte Catálogo de Dados e Práticas recomendadas de implantação do Microsoft Purview para análise em escala de nuvem.