Was ist Spiegelung in Fabric?

Die Lösung der Datenbankspiegelung in Fabric dient der Datenreplikation und ist eine kostengünstige und latenzarme Lösung, um Daten aus verschiedenen Systemen in einer einzigen Analyseplattform zusammenzuführen. Sie können Ihren vorhandenen Datenbestand kontinuierlich direkt in das OneLake von Fabric replizieren, einschließlich Daten aus Azure SQL-Datenbank, Azure Cosmos DB, Azure Databricks und Snowflake.

Mit den aktuellsten Daten in einem abfragefähigen Format in OneLake können Sie jetzt alle verschiedenen Dienste in Fabric verwenden, z. B. Ausführung von Analysen mit Spark, Ausführung von Notebooks, Datentechnik, Visualisierung über Power BI-Berichte und vieles mehr.

Spiegeln in Fabric bietet Benutzern ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt nutzen, das auf die vereinfachte Verwaltung von Analysen ausgelegt ist. Für Offenheit und Zusammenarbeit zwischen Microsoft und Technologielösungen entwickelt, die das Open-Source-Delta Lake-Tabellenformat lesen können, ist die Spiegelung eine kostengünstige und low-latency Turnkey-Lösung, mit der Sie ein Replikat Ihrer Daten in OneLake erstellen können, das für alle Ihre analytischen Anforderungen verwendet werden kann.

Die Delta-Tabellen können dann überall in Fabric verwendet werden, wodurch Benutzer ihre Reise in Fabric beschleunigen können.

Gründe für die Verwendung von Spiegelung in Fabric.

Heute verfügen viele Organisationen über unternehmenskritische oder analytische Daten, die in Silos sitzen.

Für den Zugriff und die Arbeit mit diesen Daten sind komplexe ETL-Pipelines (Extract Transform Load), Geschäftsprozesse und Entscheidungssilos erforderlich, mit folgenden Nachteilen:

  • Eingeschränkter und beschränkter Zugriff auf wichtige, sich ständig ändernde Daten
  • Reibung zwischen Menschen, Prozessen und Technologien
  • Lange Wartezeiten zum Erstellen von Datenpipelinen und Prozessen zu kritisch wichtigen Daten
  • Keine Freiheit, die Tools zu verwenden, die Sie benötigen, um Einblicke bequem zu analysieren und zu teilen
  • Mangel an einer richtigen Grundlage für Mitarbeiter, um Daten zu teilen und zusammenzuarbeiten
  • Keine gängigen, offenen Datenformate für alle analytischen Szenarien – BI, AI, Integration, Engineering und sogar Apps

Die Spiegelung in Fabric ermöglicht es, Erkenntnisse und Entscheidungen schneller zu nutzen und Datensilos zwischen Technologielösungen zu beseitigen:

  • Nahezu echtzeitbasierte Replikation von Daten in einen SaaS Data Lake mit integrierter Analyse für BI und KI

Die Platform Microsoft Fabric basiert auf der Grundlage von Software as a Service (SaaS), die Einfachheit und Integration auf ein völlig neues Niveau hebt. Weitere Informationen zu Microsoft Fabric finden Sie unter Was ist Microsoft Fabric?

Die Spiegelung erstellt drei Elemente in Ihrem Fabric-Arbeitsbereich:

  • Die Spiegelung verwaltet die Replikation von Daten in OneLake und die Konvertierung in Parquet in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
  • Ein SQL-Analyseendpunkt
  • Ein Standardsemantikmodell

Neben dem Microsoft Fabric SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools wie SQL Server Management Studio, Azure Data Studio und sogar GitHub Copilot.

Teilen ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, um sicherzustellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Teilen ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer gesamten Organisation.

Derzeit sind die folgenden externen Datenbanken verfügbar:

Plattform Replikation in Quasi-Echtzeit End-to-End-Tutorial
Spiegeldatenbanken in Microsoft Fabric von Azure Cosmos DB (Vorschau) Ja Lernprogramm: Azure Cosmos DB
Gespiegelte Microsoft Fabric-Datenbanken aus Azure Databricks (Vorschau) Ja Tutorial: Azure Databricks
Gespiegelte Datenbanken in Microsoft Fabric aus Azure SQL-Datenbank (Vorschau) Ja Lernprogramm: Azure SQL-Datenbank
Gespiegelte Datenbanken in Microsoft Fabric aus Snowflake Ja Lernprogramm: Snowflake

Wie funktioniert die Quasi-Echtzeit-Replikation der Spiegelung?

Die Spiegelung wird durch Erstellen einer sicheren Verbindung mit Ihrer betrieblichen Datenquelle aktiviert. Sie wählen aus, ob eine gesamte Datenbank oder einzelne Tabellen repliziert werden soll und die Spiegelung wird Ihre Daten automatisch synchronisieren. Nach der Einrichtung werden die Daten kontinuierlich in OneLake für den Analyseverbrauch gespiegelt.

Im Folgenden sind die Kernprinzipien der Spiegelung aufgelistet:

  • Das Aktivieren der Spiegelung in Fabric ist einfach und intuitiv. Dazu müssen keine komplexeren ETL-Pipelines erstellt werden, weitere Computeressourcen zugeordnet oder Datenverschiebungen verwaltet werden.

  • Die Spiegelung in Fabric ist ein vollständig verwalteter Dienst, daher müssen Sie sich keine Gedanken über Hosting, Pflege oder die Verwaltung der Replikation der gespiegelten Verbindung machen.

Freigabe

Tilen ermöglicht die erleichterte Zugriffssteuerung und -verwaltung, während Sicherheitskontrollen wie Sicherheit auf Zeilenebene (RLS) und OLS (Object Level Security) und mehr sicherstellen, dass Sie den Zugriff auf vertrauliche Informationen steuern können. Teilen ermöglicht auch sichere und demokratisierte Entscheidungsfindung in Ihrer gesamten Organisation.

Durch die Freigabe gewähren Benutzer*innen anderen Benutzer*innen oder einer Gruppe von Benutzer*innen Zugriff auf eine gespiegelte Datenbank, ohne Zugriff auf den Arbeitsbereich und die restlichen Elemente zu gewähren. Wenn eine Person eine gespiegelte Datenbanken freigibt, gewährt sie auch Zugriff auf den SQL-Endpunkt und das zugehörige Standardsemantikmodell.

Zugreifen auf das Dialogfeld „Teilen“ mit der Schaltfläche Teilen neben dem Namen der gespiegelten Datenbank in der Arbeitsbereichsansicht. Freigegebene Spiegeldatenbanken finden Sie über den OneLake-Datenhub oder den Abschnitt Mit mir geteilt in Microsoft Fabric.

Weitere Informationen finden Sie unter Freigeben Ihres Warehouse und Verwalten von Berechtigungen.

Datenbankübergreifende Abfragen

Mit den Daten aus Ihrer gespiegelten Datenbank, die in OneLake gespeichert sind, können Sie datenbankübergreifende Abfragen schreiben, Daten aus gespiegelten Datenbanken, Lagerorten und den SQL-Analyseendpunkten von Lakehouses in einer einzigen T-SQL-Abfrage verknüpfen. Weitere Informationen finden Sie unter Schreiben einer datenbankübergreifenden Abfrage.

Sie können z. B. auf die Tabelle aus gespiegelte Datenbanken und Lagerorten mit dreiteiliger Benennung verweisen. Im folgenden Beispiel wird der dreiteilige Name verwendet, um im Lagerort ContosoWarehouse auf ContosoSalesTable zu verweisen. Aus anderen Datenbanken oder Lagerorten ist der erste Teil der standardmäßigen SQL-dreiteiligen Benennungskonvention der Name der gespiegelten Datenbank.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Datentechnik mit Ihren Daten aus gespiegelten Datenbanken

Microsoft Fabric bietet verschiedene Datentechnikfunktionen, um sicherzustellen, dass Ihre Daten leicht zugänglich, gut organisiert und von hoher Qualität sind. Von Fabric-Datentechnik aus bestehen folgende Möglichkeiten:

  • Erstellen und Verwalten Ihrer Daten als Spark mit einem Lakehouse
  • Entwerfen von Pipelines zum Kopieren von Daten in Ihr Lakehouse
  • Verwenden von Spark-Auftragsdefinitionen zum Übermitteln eines Batch-/Streamingauftrags an den Spark-Cluster
  • Verwenden von Notebooks zum Schreiben von Code für die Datenerfassung, -aufbereitung und -transformation

Data Science mit Ihren gespiegelte Datenbankdaten

Mit Microsoft Fabric bietet Benutzer*innen Synapse Data-Science, um komplette End-to-End-Data-Science-Arbeitslasten für Datenanreicherung und geschäftliche Erkenntnisse abzuschließen. Sie können eine Vielzahl von Aktivitäten im gesamten Data-Science-Prozess durchführen, unter anderem die Untersuchung, Aufbereitung und Bereinigung von Daten sowie Experimente, Modellierung, Modellbewertung, Bereitstellung von Vorhersageerkenntnissen und BI-Berichte (Business Intelligence).

Microsoft Fabric-Benutzer können auf Data Science-Arbeitslasten zugreifen. Dort können sie verschiedene relevante Ressourcen finden und auf sie zugreifen. Sie können beispielsweise mit maschinellem Lernen Experimente, Modelle und Notebooks erstellen. Sie können auch vorhandene Notebooks auf der Data-Science-Startseite importieren.