Zielzone für die Datenverwaltung

Artikel
01/24/2025

Die Datenverwaltungs-Zielzone ist eine Verwaltungsfunktion, die für cloudweite Analysen zentral ist. Sie ist verantwortlich für die Governance Ihrer Analyseplattform.

Ihre Zielzone für die Datenverwaltung ist ein separates Abonnement, das die gleichen Standarddienste der Azure-Zielzone bietet. Sie ermöglicht die Datengovernance Ihrer Daten über Crawler, die eine Verbindung mit Ihren Data Lakes und polyglotten Speicher in Ihren Datenzielzonen herstellen. Virtuelles Netzwerk-Peering verbindet Ihre Datenverwaltungs-Zielzone mit Ihren Daten-Zielzonen und Konnektivitäts-Abonnements.

Diese Architektur ist ein Ausgangspunkt, und Sie können sie an Ihre spezifischen geschäftlichen und technischen Anforderungen anpassen, wenn Sie Ihre Datenverwaltungs-Landing Zone Implementierung planen.

Hinweis

Mehrsprachige Persistenz ist ein Speicherbegriff, der Ihre Wahl zwischen verschiedenen Datenspeicher-/Datenspeichertechnologien beschreibt, um Ihre verschiedenen Datentypen und ihre Speicheranforderungen zu unterstützen. Mehrsprachige Persistenz ist im Wesentlichen das Konzept, dass eine Anwendung mehr als eine Kerndatenbank oder Speichertechnologie verwenden kann.

Wichtig

Ihre Datenverwaltungszielzone muss als separates Abonnement unter einer Verwaltungsgruppe mit der entsprechenden Governance bereitgestellt werden. Anschließend können Sie die Governance in Ihrer Organisation steuern. Der Azure-Zielzonenbeschleuniger veranschaulicht, wie Sie Azure-Zielzonen angehen sollten.

Datenverwaltung

Cloud Scale Analytics schlägt die Verwendung von Microsoft Purview vor. Alternativ können Microsoft Partner-Lösungen bereitgestellt werden, um bestimmte Data-Governance-Funktionen zu verwalten. Zu den wichtigsten Funktionen, die Sie in Ihrer Architektur berücksichtigen sollten, gehören ein globaler Datenkatalog, die Stammdatenverwaltung, die Datenfreigabe und Verträge, der API-Katalog, die Datenqualitätsverwaltung und ein Datenmodellierungs-Repository.

Microsoft Partner-Data-Governance-Produkte, die eine Bereitstellung in einem Abonnement benötigen, sollten in der Data-Governance-Ressourcengruppe innerhalb der Datenverwaltungszielzone bereitgestellt werden.

Datenkatalog

Der Datenkatalog registriert und pflegt die Dateninformationen an einem zentralen Ort und macht sie für die Organisation verfügbar. Dadurch wird sichergestellt, dass Unternehmen doppelte Datenprodukte vermeiden, die durch redundante Datenerfassung durch verschiedene Projektteams verursacht werden. Es wird empfohlen, einen Datenkatalogdienst zu erstellen, um die Metadaten der Datenprodukte zu definieren, die in den Datenzielzonen gespeichert sind.

Cloud-Skalierungsanalysen sind von Microsoft Purview abhängig, um Unternehmensdatenquellen zu registrieren, sie zu klassifizieren, die Datenqualität sicherzustellen und einen sicheren Self-Service-Zugriff zu bieten.

Microsoft Purview ist ein Dienst auf Mandantenebene und kann mit jeder Datenzielzone kommunizieren, indem ein verwaltetes virtuelles Netzwerk erstellt wird, das in der Region Ihrer Datenzielzonen bereitgestellt ist. Sie können Azure Managed Virtual Network Integration Runtimes (IR) in Microsoft Purview Managed Virtual Networks in jeder verfügbaren Microsoft Purview-Region bereitstellen. Von dort aus kann die verwaltete IR des virtuellen Netzwerks private Endpunkte verwenden, um eine sichere Verbindung mit den unterstützten Datenquellen herzustellen und diese zu überprüfen. Weitere Informationen finden Sie unter Verwenden des verwalteten virtuellen Netzwerks mit Ihrem Microsoft Purview-Konto. Durch das Erstellen einer IR in einem verwaltetem virtuellen Netzwerk wird sichergestellt, dass der Datenintegrationsprozess isoliert und sicher ist.

Bei Verwendung von Azure Databricks empfehlen wir zusätzlich zu Microsoft Purview Azure Databricks Unity Catalog zu verwenden. Azure Databricks Unity Catalog bietet zentrale Zugriffssteuerung, Überwachung, Herkunftsnachverfolgung und Funktionen zur Datenerkennung in Databricks-Arbeitsbereichen. Bewährte Methoden zum Einrichten von Unity Catalog finden Sie unter Bewährte Methoden für Unity Catalog.

Hinweis

Obwohl sich diese Dokumentation in erster Linie auf die Verwendung von Microsoft Purview für die Governance konzentriert, haben Unternehmen möglicherweise in andere Produkte investiert, z. B. Alation, Okera oder Collibra. Diese Lösungen basieren auf Abonnements und wir empfehlen, sie in der Datenverwaltungszielzone bereitzustellen. Beachten Sie, dass möglicherweise organisationsspezifische Integrationsmaßnahmen erforderlich sind.

Masterdatenverwaltung

Die Masterdatenverwaltungssteuerung befindet sich in der Zielzone für die Datenverwaltung. Die Masterdatenverwaltung im Data Mesh enthält bestimmte Überlegungen, die Sie für Data Mesh aufrufen sollten.

Viele Lösungen zur Masterdatenverwaltung sind vollständig in Microsoft Entra ID integriert. Diese Integration ermöglicht es Ihnen, Ihre Daten zu schützen und unterschiedliche Ansichten für verschiedene Benutzergruppen bereitzustellen.

Weitere Informationen finden Sie unter Master Data Management System.

Analysen auf Cloudebene verwenden die Microsoft Entra-Berechtigungsverwaltung oder Microsoft Purview-Richtlinien, um den Zugriff auf die Datenfreigabe zu steuern. Selbst dann benötigen Sie möglicherweise noch eine Freigabe und ein Vertrags-Repository. Dieses Repository ist eine Organisationsfunktion und sollte sich in Ihrer Zielzone für die Datenverwaltung befinden.

Ihre Verträge sollten Informationen über Datenvalidierung, Modelle und Sicherheitsrichtlinien enthalten.

Weitere Informationen finden Sie unter Datenverträge.

API-Katalog

Ihre Datenanwendungsteams erstellen verschiedene APIs für ihre Datenanwendungen. Diese APIs können in anderen Teilen Ihrer Organisation schwer zu finden sein. Ein API-Katalog in Ihrer Datenverwaltungszielzone kann helfen, dieses Problem zu lösen.

Ein API-Katalog unterstützt die Standardisierung Ihrer Dokumentation und bietet einen Ort für die interne Zusammenarbeit an APIs. Er kann auch Steuermechanismen für Nutzung, Veröffentlichung und Governance in Ihrer gesamten Organisation fördern.

Datenqualitätsverwaltung

Fahren Sie mit Ihrer aktuellen Lösung fort.

Verwalten Sie die Datenqualität so nah wie möglich an der Datenquelle, um zu verhindern, dass Qualitätsprobleme auf Ihre Analyse- und KI-Systeme verteilt werden. Indem Sie Qualitätsmetriken und Validierung in Ihre Datenprozesse integrieren, richten Sie das Qualitätsmanagement an die Teams aus, die mit den Daten am vertrautsten sind, um ein tieferes Verständnis und eine bessere Handhabung der Datenressourcen sicherzustellen.

Die Datenherkunft schafft auch Vertrauen in die Datenqualität. Sie sollten sie für alle Datenprodukte bereitstellen.

Weitere Informationen zur Datenqualitätsverwaltung finden Sie unter Datenqualität.

Datenmodellierungs-Repository

Sie sollten Entitätsbeziehungsmodelle an einem zentralen Ort in Ihrer Zielzone für die Datenverwaltung erfassen und speichern, sodass Datenkunden einen einzigen Ort zum Auffinden konzeptioneller Diagramme haben.

Viele Kunden verwenden ER Studio und OrbusInfinity, um ihre Datenprodukte vor der Aufnahme zu modellieren.

Dienstebene

Ihre Organisation kann entscheiden, viele Automatisierungsdienste zu erstellen, um Cloud-Skalierungsanalysefunktionen zu erweitern. Diese Automatisierungsdienste fördern die Konformitäts- und Onboardinglösungen für Ihren Analysezustand.

Wenn Sie sich entscheiden, diese Automatisierungsdienste zu erstellen, sollten Sie über eine Benutzeroberfläche verfügen, die sowohl als Datenmarkt als auch als Betriebskonsole fungiert. Diese Schnittstelle sollte auf einem zugrunde liegenden Metadatenspeicher wie Metadatenstandards basieren.

Der Datenmarkt oder die Betriebskonsole ruft eine mittlere Ebene von Microservices auf, um das Onboarding, die Metadatenregistrierung, die Sicherheitsbereitstellung, den Datenlebenszyklus und die Sichtbarkeit zu erleichtern.

Sie können die Ressourcengruppe der Dienstebene bereitstellen, um Ihren Metadatenspeicher zu hosten.

Wichtig

Keine dieser Automatisierungsdienste sind Produkte, und sie veranschaulichen kein Roadmap-Element. Sie werden aufgeführt, um Ihnen dabei zu helfen, welche Elemente Sie möglicherweise automatisieren möchten.

Dienst	Dienstbereich
Bereitstellung der Datenzielzone	Dieser Dienst erstellt eine neue Datenzielzone. Es ist unwahrscheinlich, dass es häufig verwendet wird, aber für die Vollständigkeit der End-to-End-Onboarding-Lösung ist es enthalten. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse
Datenprodukt-Onboarding	Dieser Dienst erstellt und ändert Ressourcengruppen, die sich auf einen integrierten Mandanten beziehen. Außerdem enthält sie Funktionen zur Aktualisierung und Herabstufung von SKUs und zum Aktivieren und Deaktivieren von Ressourcengruppen für jeden angeschlossenen Mandanten oder Dienst. Es erstellt eine neue Datenzielzone DevOps. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse
Datenagnostische Aufnahme	Dieser Microservice erstellt neue Datenquellen zur Integration in Ihre Datenzielzonen, indem er mit einem Azure Data Factory SQL-Datenbank-Metastore in jeder Datenzielzone kommuniziert. Weitere Informationen finden Sie unter Unterstützung der Analysen auf Cloudebene in Azure durch Frameworks zur automatisierten Erfassung
Metadaten	Dieser Dienst macht Metadaten für die Plattform verfügbar und erstellt sie. Weitere Informationen finden Sie unter Metadatenstandards
Zugriffsbereitstellung	Dieser Dienst erstellt Zugriffspakete, Zugriffsrichtlinien und Genehmigungsprozesse für den Ressourcenzugriff (manuell oder automatisch) mithilfe von SPN/UPN. Sie kann eine API auch verfügbar machen, um eine Liste der Abonnementanforderungen (Assets) bereitzustellen, die Benutzer in den letzten 90 Tagen übermittelt haben. Weitere Informationen finden Sie unter Datenzugriffsverwaltung
Datenlebenszyklus:	Dieser Dienst ist verantwortlich für die Wartung des Datenlebenszyklus basierend auf Metadaten. Diese Wartung kann das Verschieben von Daten in den Cold Storage und das Löschen von Datensätzen umfassen, die nicht mehr aufbewahrt werden müssen. Weitere Informationen finden Sie unter Lebenszyklusverwaltung
Onboarding von Datendomänen	GILT NUR FÜR DATA MESH. Dieser Dienst erfasst Metadaten im Zusammenhang mit neuen Domänen und integriert die neuen Domänen nach Bedarf. Er kann auch alle Domänen- oder Dienstzeilen erstellen, aktualisieren, aktivieren und deaktivieren, die Sie möglicherweise in einen Microservice erstellen. Weitere Informationen finden Sie unter Bereitstellung der Cloud-Skalierungsanalyse

Azure Container Registry

Ihre Datenverwaltungszielzone hostet eine Azure Container Registry. Mit dem Azure Container Registry können Ihre Datenplattformvorgänge Standardcontainer für die Verwendung in Data Science-Projekten bereitstellen, die Ihre Datenanwendungsteams nutzen.

Nächste Schritte

Übersicht über die Datenzielzone

Freigeben über