Dimensionale Modellierung in Microsoft Fabric Warehouse

Gilt für:✅ SQL-Analyseendpunkt und Warehouse in Microsoft Fabric

Dieser Artikel ist der erste in einer Reihe über die dimensionale Modellierung innerhalb eines Lagers. Er bietet eine praktische Anleitung für das Warehouse in Microsoft Fabric, das viele T-SQL-Funktionen wie die Erstellung von Tabellen und die Verwaltung von Daten in Tabellen unterstützt. Sie haben also die vollständige Kontrolle über die Erstellung Ihrer Dimensionsmodelltabellen und das Laden dieser mit Daten.

Hinweis

In diesem Artikel bezieht sich der Begriff Data Warehouse auf ein Enterprise Data Warehouse, das umfassende Integration kritischer Daten in der gesamten Organisation bereitstellt. Im Gegensatz dazu bezieht sich der eigenständige Begriff Warehouse auf ein Fabric Warehouse, bei dem es sich um eine Software-as-a-Service (SaaS)-relationale Datenbank handelt, die Sie zum Implementieren eines Data Warehouse verwenden können. Aus Gründen der Klarheit wird in diesem Artikel letzteres als Fabric Warehouse erwähnt.

Tipp

Wenn Sie noch keine Erfahrung mit der dimensionalen Modellierung haben, ist diese Artikelserie Ihr erster Schritt. Sie soll keine vollständige Diskussion über die dimensionale Modellierung von Designs bieten. Weitere Informationen finden Sie direkt in weit verbreiteten Veröffentlichungen wie The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3. Ausgabe, 2013) von Ralph Kimball und anderen.

Sternschemaentwurf

Sternschema ist eine dimensionale Modellierungsentwurfstechnik, die weit verbreitet in relationalen Data Warehouse zum Einsatz kommt. Es ist ein empfohlener Entwurfsansatz, der beim Erstellen eines Fabric Warehouses zu ergreifen ist. Ein Sternschema umfasst Faktentabellen und Dimensionstabellen.

  • Dimensionstabellen beschreiben die Entitäten, die für Ihre Organisation und Analyseanforderungen relevant sind. Im Allgemeinen stellen sie die Elemente dar, die Sie modellieren. Es kann sich um Produkte, Personen, Orte oder ein anderes Konzept handeln, einschließlich Datum und Zeit. Weitere Informationen und bewährte Methoden zum Entwerfen finden Sie in den Dimensionstabellen dieser Reihe.
  • Faktentabellen speichern Messungen im Zusammenhang mit Beobachtungen oder Ereignissen. Sie können Kundenaufträge, Lagerbestände, Wechselkurse, Temperaturwerte und vieles mehr speichern. Faktentabellen enthalten Dimensionsschlüssel zusammen mit granularen Werten, die aggregiert werden können. Weitere Informationen und bewährte Methoden zum Entwerfen finden Sie in den Faktentabellen dieser Reihe.

Ein Sternschemadesign ist für Analyseabfrageworkloads optimiert. Aus diesem Grund wird es als Voraussetzung für semantische Modelle in Power BI angesehen. Analyseabfragen betreffen das Filtern, Gruppieren, Sortieren und Zusammenfassen von Daten. Faktendaten werden im Kontext von Filtern und Gruppierungen der zugehörigen Dimensionstabellen zusammengefasst.

Der Grund dafür, warum es als Sternschema bezeichnet wird, ist, dass eine Faktentabelle die Mitte eines Sterns bildet, während die zugehörigen Dimensionstabellen die Punkte des Sterns bilden.

Das Diagramm zeigt eine Abbildung eines Sternschemas für Verkaufsdaten. Es gibt fünf Dimensionen, die jeweils an einem Punkt des Sterns liegen.

Ein Sternschema enthält häufig mehrere Faktentabellen und daher mehrere Sterne.

Ein gut gestaltetes Sternschema liefert leistungsstarke (relationale) Abfragen aufgrund weniger Tabellenverbindungen und der höheren Wahrscheinlichkeit nützlicher Indizes. Außerdem erfordert ein Sternschema häufig eine geringe Wartung, da sich das Data Warehouse-Design weiterentwickelt. Beispielsweise ist das Hinzufügen einer neuen Spalte zu einer Dimensionstabelle zur Unterstützung der Analyse durch ein neues Attribut eine relativ einfache Aufgabe. Ebenso wie das Hinzufügen neuer Fakten und Dimensionen, da sich der Umfang des Data Warehouse weiterentwickelt.

In regelmäßigen Abständen werden die Tabellen in einem dimensionalen Modell von einem ETL-Prozess (Extrahieren, Transformieren und Laden) aktualisiert und geladen. Dieser Prozess synchronisiert seine Daten mit den Quellsystemen, die Betriebsdaten speichern. Weitere Informationen finden Sie unter Tabellen laden in dieser Serie.

Dimensionale Modellierung für Power BI

Für Unternehmenslösungen ist ein dimensionales Modell in einem Fabric Warehouse eine empfohlene Voraussetzung für die Erstellung eines Power BI-Semantikmodells. Das dimensionale Modell unterstützt nicht nur das semantische Modell, sondern es ist auch eine Datenquelle für andere Erfahrungen, z. B. Machine Learning-Modelle.

Unter bestimmten Umständen ist dies jedoch möglicherweise nicht der beste Ansatz. Beispielsweise können Self-Service-Analysten, die schnell und flexibel agieren müssen, ohne von der IT-Abteilung abhängig zu sein, semantische Modelle erstellen, die direkt mit den Quelldaten verbunden sind. In solchen Fällen ist die Theorie der dimensionalen Modellierung noch relevant. Diese Theorie hilft Analysten dabei, intuitive und effiziente Modelle zu erstellen und gleichzeitig die Notwendigkeit zu vermeiden, ein dimensionales Modell in einem Data Warehouse zu erstellen und zu laden. Stattdessen kann mithilfe von Power Query ein quasidimensionales Modell erstellt werden, das die Logik definiert, mit der eine Verbindung mit Quelldaten hergestellt und geladen werden soll, um die Semantikmodelltabellen zu erstellen und zu laden. Weitere Informationen finden Sie im Artikel Informationen zum Sternschema und der Wichtigkeit für Power BI.

Wichtig

Wenn Sie Power Query verwenden, um ein dimensionales Modell im semantischen Modell zu definieren, können Sie keine historischen Änderungen verwalten, die für eine genaue Analyse der Vergangenheit erforderlich sein könnten. Wenn dies eine Anforderung ist, sollten Sie ein Data Warehouse erstellen und regelmäßige ETL-Prozesse zulassen, um Dimensionsänderungen zu erfassen und entsprechend zu speichern.

Planen eines Data Warehouses

Sie sollten die Erstellung eines Data Warehouse und den Entwurf eines Dimensionsmodells als ein ernsthaftes und wichtiges Unterfangen betrachten. Das liegt daran, dass das Data Warehouse eine Kernkomponente Ihrer Datenplattform ist. Es sollte eine solide Grundlage bilden, die Analysen und Berichte – und damit die Entscheidungsfindung – für Ihr gesamtes Unternehmen unterstützt.

Zu diesem Zweck sollte Ihr Data Warehouse bestrebt sein, Qualität zu speichern, konformen und historisch genauen Daten als eine einzige Version der Wahrheit zu speichern. Es sollte verständliche und navigierbare Daten mit schneller Leistung liefern und Berechtigungen erzwingen, damit die richtigen Daten nur von den richtigen Personen aufgerufen werden können. Bemühen Sie sich, Ihr Data Warehouse für Resilienz zu entwerfen, sodass es sich anpassen kann, wenn sich Ihre Anforderungen weiterentwickeln.

Die erfolgreiche Implementierung eines Data Warehouse hängt von einer guten Planung ab. Informationen zu strategischen und taktischen Überlegungen und Aktionen, die zur erfolgreichen Einführung von Fabric und Ihrem Data Warehouse führen, finden Sie in der Roadmap zur Einführung von Microsoft Fabric.

Tipp

Es wird empfohlen, ihr Enterprise Data Warehouse iterativ zu erstellen. Beginnen Sie zuerst mit den wichtigsten Themenbereichen und erweitern Sie dann im Laufe der Zeit nach Priorität und Ressourcen das Data Warehouse mit anderen Themenbereichen.

Im nächsten Artikel dieser Reihe erfahren Sie mehr über Anleitungen und bewährte Entwurfsverfahren für Dimensionstabellen.