Was sind Dataflows?

Tipp

Testen Sie Dataflow Gen2 in Data Factory in Microsoft Fabric, einer All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Dataflows sind eine cloudbasierte Self-Service-Technologie zur Datenaufbereitung. Dataflows ermöglichen Kunden die Aufnahme, Umwandlung und das Laden von Daten in Microsoft Dataverse-Umgebungen, Power BI-Arbeitsbereiche oder das Azure Data Lake Storage-Konto Ihres Unternehmens. Dataflows werden mithilfe von Power Query erstellt, einer einheitlichen Oberfläche zur Datenkonnektivität und -vorbereitung, die bereits in vielen Microsoft-Produkten einschließlich Excel und Power BI enthalten ist. Die Kunden können Dataflows entweder nach Bedarf oder automatisch nach einem Zeitplan ablaufen lassen; die Daten sind immer auf dem neuesten Stand.

Dataflows können in mehreren Microsoft-Produkten erstellt werden

Dataflows sind in mehreren Microsoft-Produkten enthalten und erfordern keine Dataflow-spezifische Lizenz, um erstellt oder ausgeführt zu werden. Dataflows sind in Power Apps, Power BI und Dynamics 365 Customer Insights verfügbar. Die Möglichkeit, Dataflows zu erstellen und auszuführen, ist in den Lizenzen dieser Produkte enthalten. Die meisten Dataflow-Funktionen sind in allen Produkten, in denen sie enthalten sind, gleich, aber einige produktspezifische Funktionen können in Dataflows vorhanden sein, die in einem Produkt erstellt wurden, nicht aber in einem anderen.

Wie funktioniert der Dataflow?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

Die vorherige Abbildung zeigt eine Gesamtübersicht über die Definition eines Dataflows. Ein Dataflow bezieht Daten aus verschiedenen Datenquellen (mehr als 80 Datenquellen werden bereits unterstützt). Auf der Grundlage der mit der Power Query Authoring Experience konfigurierten Transformationen transformiert der Dataflow dann die Daten mit Hilfe der Dataflow-Engine. Schließlich werden die Daten in das Ausgabeziel geladen, bei dem es sich um eine Microsoft Power Platform-Umgebung, einen Power BI-Arbeitsbereich oder das Azure Data Lake Storage-Konto des Unternehmens handeln kann.

Dataflows laufen in der Cloud

Dataflows sind Cloud-basiert. Wenn ein Dataflow erstellt und gespeichert wird, wird seine Definition in der Cloud gespeichert. Ein Dataflow läuft auch in der Cloud. Handelt es sich jedoch um eine lokale Datenquelle, kann ein lokales Daten-Gateway verwendet werden, um die Daten in die Cloud zu extrahieren. Wenn ein Dataflowlauf ausgelöst wird, findet die Datenumwandlung und -berechnung in der Cloud statt, und das Ziel befindet sich immer in der Cloud.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Dataflows verwenden eine leistungsstarke Transformations-Engine

Power Query ist die Datenumwandlungsmaschine, die im Dataflow verwendet wird. Dieser Motor ist fähig genug, um viele fortgeschrittene Transformationen zu unterstützen. Außerdem verwendet es eine einfache, aber leistungsstarke grafische Benutzeroberfläche namens Power Query Editor. Sie können mit diesem Editor Dataflows verwenden, um Ihre Datenintegrationslösungen schneller und einfacher zu entwickeln.

Screenshot showing an example of Power Query transformations.

Dataflowintegration mit Microsoft Power Platform und Dynamics 365

Da ein Dataflow die resultierenden Tabellen in einem Cloud-basierten Speicher speichert, können andere Dienste mit den von Dataflows erzeugten Daten interagieren.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Beispielsweise können Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- und Dynamics 365-Anwendungen die vom Dataflow erzeugten Daten abrufen, indem sie eine Verbindung mit Dataverse, einem Power Platform-Dataflowconnector oder direkt über den Lake herstellen, je nachdem, wo das Ziel zur Erstellungszeit des Dataflows konfiguriert wurde.

Vorteile von Dataflows

In der folgenden Liste werden einige der Vorteile der Verwendung von Dataflows hervorgehoben:

  • Ein Dataflow entkoppelt die Datentransformationsebene von der Modellierungs- und Visualisierungsebene in einer Power BI-Lösung.

  • Der Datentransformationscode kann sich an einem zentralen Ort befinden, in einem Dataflow, anstatt auf mehrere Artefakte verteilt zu werden.

  • Ein Dataflowersteller benötigt nur Power Query-Fähigkeiten. In einer Umgebung mit mehreren Erstellern kann der Dataflowersteller Teil eines Teams sein, das zusammen die gesamte BI-Lösung oder betriebsbereite Anwendung erstellt.

  • Ein Dataflow ist produktunabhängig. Es ist nicht nur eine Komponente von Power BI; Sie können die Daten auch in anderen Tools und Diensten abrufen.

  • Dataflows profitieren von Power Query, einer leistungsstarken grafischen Self-Service-Oberfläche zur Datentransformation.

  • Dataflows werden vollständig in der Cloud ausgeführt. Es ist keine zusätzliche Infrastruktur erforderlich.

  • Sie haben mehrere Optionen, die Arbeit mit Dataflows zu beginnen, indem Sie Lizenzen für Power Apps, Power BI und Customer Insights verwenden.

  • Obwohl Dataflows zu fortgeschrittenen Transformationen fähig sind, sind sie für Self-Service-Szenarien konzipiert und erfordern keinen IT- oder Entwicklerhintergrund.

Anwendungsszenarien für Dataflows

Sie können Dataflows für viele Zwecke verwenden. Die folgenden Szenarien bieten einige Beispiele für häufige Anwendungsfälle von Dataflows.

Datenmigration von Altsystemen

In diesem Szenario hat sich ein Unternehmen entschieden, Power Apps für die neue Benutzeroberfläche zu verwenden und nicht das alte System vor Ort. Power Apps, Power Automate und AI Builder verwenden alle Dataverse als primäres Datenspeichersystem. Die aktuellen Daten im vorhandenen lokalen System können mit Hilfe eines Dataflows in Dataverse migriert werden, und dann können diese Produkte diese Daten nutzen.

Verwendung von Dataflows zum Aufbau eines Data Warehouse

Sie können Dataflows als Ersatz für andere Extraktions-, Transformations- und Ladetools (ETL) verwenden, um ein Data Warehouse aufzubauen. In diesem Szenario entscheiden sich die Dateningenieure eines Unternehmens für die Verwendung von Dataflows, um ihr nach einem Sternschema entworfenes Data Warehouse mit Fakten- und Dimensionstabellen in Data Lake Storage aufzubauen. Dann wird Power BI verwendet, um Berichte und Dashboards zu erstellen, indem Daten aus den Dataflows abgerufen werden.

Image of how to build a data warehouse using dataflows.

Verwendung von Dataflows zum Aufbau eines dimensionalen Modells

Sie können Dataflows als Ersatz für andere ETL-Tools verwenden, um ein Dimensionsmodell zu erstellen. Die Dateningenieure eines Unternehmens entscheiden sich beispielsweise für die Verwendung von Dataflows, um das in einem Sternschema entworfene Dimensionsmodell einschließlich Fakten- und Dimensionstabellen in Azure Data Lake Storage Gen2 zu erstellen. Dann wird Power BI verwendet, um Berichte und Dashboards zu erstellen, indem Daten aus den Dataflows abgerufen werden.

Image of how to build a dimensional model using dataflows.

Zentralisierung der Datenaufbereitung und Wiederverwendung von semantischen Modellen über mehrere Power BI-Lösungen hinweg

Wenn mehrere Power BI-Lösungen dieselbe transformierte Version einer Tabelle verwenden, wird der Prozess zur Erstellung der Tabelle mehrfach wiederholt. Dies erhöht die Belastung des Quellsystems, verbraucht mehr Ressourcen und erzeugt doppelte Daten mit mehreren Fehlerpunkten. Stattdessen kann ein einziger Dataflow erstellt werden, um die Daten für alle Lösungen zu berechnen. Power BI kann dann das Ergebnis der Transformation in allen Lösungen wiederverwenden. Der Dataflow kann, wenn er auf diese Weise verwendet wird, Teil einer robusten Power BI-Implementierungsarchitektur sein, die Power Query-Code-Duplikate vermeidet und die Wartungskosten der Datenintegrationsschicht reduziert.

Image of how tables can be reused across multiple solutions.

Nächste Schritte

Die folgenden Artikel bieten weiteres Studienmaterial für Dataflows.