Información general de la zona de aterrizaje de la gestión de datos del análisis a escala de la nube

Artículo
10/01/2024

La zona de aterrizaje de la gestión de datos es una función de gestión y es fundamental para el análisis a escala de la nube. Es responsable de la gobernanza de la plataforma de análisis.

La zona de aterrizaje de la administración de datos es una suscripción independiente que tiene los servicios estándar de una zona de aterrizaje de Azure. Permite la gobernanza de datos de sus datos a través de rastreadores, que se conectan a sus lagos de datos y al almacenamiento políglota en sus zonas de aterrizaje de datos. El emparejamiento de red virtual conecta la zona de aterrizaje de administración de datos a las zonas de aterrizaje de datos y a la suscripción de conectividad.

Use esta arquitectura como punto de partida. Descargue el archivo de Visio y modifíquelo para que se ajuste a sus requisitos técnicos y empresariales concretos al planear la implementación de la zona de aterrizaje de administración de datos.

Nota

La persistencia políglota es un término de almacenamiento que describe su elección entre diferentes tecnologías de almacenamiento de datos/almacenes de datos para soportar sus diversos tipos de datos y sus necesidades de almacenamiento. Principalmente, la persistencia políglota es el concepto de que una aplicación puede usar más de una tecnología de almacenamiento o base de datos principal.

Importante

La zona de aterrizaje de administración de datos deberá implementarse como una suscripción independiente en un grupo de administración con la gobernanza adecuada. Después, puede controlar la gobernanza en toda la organización. El acelerador de zonas de aterrizaje de Azure muestra cómo debe abordar las zonas de aterrizaje de Azure.

Catálogo de datos

Grupo de recursos: governance-rg

El catálogo de datos registra y mantiene la información de datos en un lugar centralizado y hace que esté disponible para la organización. Garantiza que las empresas eviten conjuntos de productos de datos duplicados causados por la ingesta redundante de datos por parte de distintos equipos de proyecto.

Se recomienda crear un servicio de catálogo de datos para definir los metadatos de los productos de datos almacenados en las zonas de aterrizaje de datos.

El análisis a escala en la nube depende de Microsoft Purview para registrar orígenes de datos empresariales, clasificarlos, garantizar la calidad de los datos y ofrecer acceso de autoservicio seguro.

Microsoft Purview es un servicio basado en inquilinos y puede comunicarse con cada zona de aterrizaje de datos mediante la creación de una red virtual administrada implementada en la región de las zonas de aterrizaje de datos. Puede implementar Azure Managed Virtual Network Integration Runtimes (IR) en redes virtuales administradas de Microsoft Purview en cualquier región de Microsoft Purview disponible. A partir de ahí, el IR de red virtual administrada puede usar puntos de conexión privados para conectarse de forma segura a los orígenes de datos compatibles y examinarlos. Para obtener más información, consulte Uso de una red virtual administrada con su cuenta de Microsoft Purview. La creación de un IR de red virtual administrada en Red virtual administrada garantiza que el proceso de integración de datos esté aislado y protegido.

Nota:

Aunque esta documentación se centra principalmente en el uso de Microsoft Purview para la gobernanza, es posible que las empresas hayan invertido en otros productos, como Alation, Okera o Collibra. Estas soluciones se basan en suscripciones y se recomienda implementarlas en la zona de aterrizaje de administración de datos. Tenga en cuenta que puede ser necesaria alguna integración personalizada.

Para más información, consulte procedimientos recomendados de implementación de Data Catalog y Microsoft Purview para el análisis a escala en la nube.