Was ist Data Warehousing in Microsoft Fabric?

Gilt für:✅ SQL-Analyseendpunkt und Warehouse in Microsoft Fabric

Microsoft Fabric ist eine Data Warehouse-Lösung der nächsten Generation in Microsoft Fabric.

Das Lake-orientierte Warehouse basiert auf einer verteilten Verarbeitungs-Engine auf Unternehmensniveau, die branchenführende Leistung ermöglicht und gleichzeitig die Notwendigkeit von Konfiguration und Verwaltung minimiert. Durch das Leben im Data Lake und zur nativen Unterstützung offener Datenformate ermöglicht Fabric Data Warehouse eine nahtlose Zusammenarbeit zwischen Dateningenieuren und Geschäftsbenutzern, ohne die Sicherheit oder Governance zu beeinträchtigen.

Die einfach zu verwendende SaaS-Umgebung ist auch eng in Power BI integriert, um Analysen und Berichte zu vereinfachen, die Welt der Data Lakes und Data Warehouses zu konvergieren und die Investitionen eines Unternehmens in seinen Analysebestand erheblich zu vereinfachen. 

Data Warehouse-Kunden profitieren von:

  • Daten, die im Delta-Parkettformat gespeichert sind, ermöglichen ACID-Transaktionen und Interoperabilität mit anderen Fabric-Workloads, bedeutet, dass Sie nicht mehrere Kopien von Daten benötigen.
  • Datenbankübergreifende Abfragen können mehrere Datenquellen nutzen, um schnelle Einblicke zu erhalten, ohne dass Daten dupliziert werden.
  • Einfaches Aufnehmen, Laden und Transformieren von Daten über Pipelines, Datenflüsse, datenbankübergreifende Abfrage oder kopieren in den Befehl KOPIEREN IN.
  • Autonome Workloadverwaltung mit branchenführenden verteilten Abfrageverarbeitungsmodulen bedeutet keine Drehregler, um optimale Leistung zu erzielen.
  • Skalieren Sie nahezu sofort , um geschäftliche Anforderungen zu erfüllen. Storage und Compute sind separat.
  • Reduzierte Zeit bis zu Erkenntnissen mit einem einfach konsumierbaren, immer verbundenen Semantikmodell, das in Power BI im Direct Lake-Modus integriert ist. Berichte verfügen immer über die neuesten Daten für Analyse und Berichterstellung.
  • Entwickelt für jedes Qualifikationsniveau, vom Bürgerentwickler bis hin zu DBA oder Dateningenieur.

Data Warehousing Elemente

Fabric Warehouse ist kein herkömmliches Enterprise Data Warehouse, es ist ein Lake Warehouse, das zwei verschiedene Lagerelemente unterstützt: das Fabric Data Warehouse und den SQL-Analyseendpunkt. Beide sind zwecks Erfüllung der geschäftlichen Anforderungen der Kunden und bieten gleichzeitig eine optimale Leistung, minimieren die Kosten und reduzierten Verwaltungsaufwand.

Data Warehouse mit Synapse

In einem Microsoft Fabric-Arbeitsbereich wird ein Synapse Data Warehouse oder Warehouse in der Spalte Typ als „Warehouse“ bezeichnet. Wenn Sie die volle Leistungsfähigkeit und Transaktionsfunktionen (DDL- und DML-Abfrageunterstützung) eines Data Warehouse benötigen, ist dies die schnelle und einfache Lösung für Sie.

Screenshot: Typ „Warehouse“ im Arbeitsbereich

Das Warehouse kann durch eine der unterstützten Datenerfassungsmethoden aufgefüllt werden (z. B. COPY INTO, Pipelines, Dataflows oder datenbankübergreifende Erfassungsoptionen wie CREATE TABLE AS SELECT (CTAS), INSERT..SELECT und SELECT INTO).

Informationen zu den ersten Schritten mit dem Warehouse finden Sie unter:

Erstellen eines Warehouse in Microsoft Fabric

SQL-Analyseendpunkt des Lakehouse

In einem Microsoft Fabric-Arbeitsbereich verfügt jedes Lakehouse über einen automatisch generierten "SQL-Analyseendpunkt", der verwendet werden kann, um von der "Lake"-Ansicht des Lakehouse (das Data Engineering und Apache Spark unterstützt) zur "SQL"-Ansicht desselben Lakehouse zu wechseln, um Ansichten, Funktionen, gespeicherte Prozeduren zu erstellen und SQL-Sicherheit anzuwenden.

Screenshot: Typ „SQL-Analytics-Endpunkt“ im Arbeitsbereich.

Mit dem SQL-Analyse-Endpunkt von Lakehouse können T-SQL-Befehle Datenobjekte definieren und abfragen, jedoch nicht manipulieren oder die Daten verändern. Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:

  • Abfragen der Tabellen, die auf Daten in Ihren Delta Lake-Ordnern im Lake verweisen
  • Erstellen von Ansichten, Inline-TVFs und Prozeduren zum Kapseln Ihrer Semantik und Geschäftslogik in T-SQL
  • Verwalten von Berechtigungen für die Objekte

Erste Schritte mit dem SQL-Analytics-Endpunkt finden Sie unter:

Warehouse oder Lakehouse

Bei der Entscheidung zwischen der Verwendung eines Warehouse oder eines Lakehouse ist es wichtig, die spezifischen Anforderungen und den Kontext Ihrer Datenverwaltungs- und Analyseanforderungen zu berücksichtigen. Ebenso wichtig ist, dass es sich nicht um eine einseitige Entscheidung handelt!

Sie haben immer die Möglichkeit, zu einem späteren Zeitpunkt das eine oder andere hinzuzufügen, wenn sich Ihre geschäftlichen Anforderungen ändern und unabhängig davon, wo Sie beginnen, sowohl das Warehouse als auch das Lakehouse verwenden dasselbe leistungsstarke SQL-Modul für alle T-SQL-Abfragen.

Hier sind einige allgemeine Richtlinien, die Ihnen bei der Entscheidungsfindung helfen sollen:

  • Wählen Sie ein Data Warehouse aus, wenn Sie eine Unternehmenslösung mit offenem Standardformat, ohne manuelles Anpassen und minimalem Setup benötigen.  Am besten geeignet für halbstrukturierte und strukturierte Datenformate eignet sich das Data Warehouse sowohl für Anfänger als auch für erfahrene Datenprofis und bietet einfache und intuitive Erfahrungen.

  • Wählen Sie ein Lakehouse aus, wenn Sie ein großes Repository mit hoch unstrukturierten Daten aus heterogenen Quellen benötigen, indem Sie kostengünstige Objektspeicher nutzen und SPARK als primäres Entwicklungstool verwenden möchten. Als "einfaches" Data Warehouse können Sie immer die SQL-Endpunkt- und T-SQL-Tools verwenden, um Berichts- und Datenintelligenzszenarien in Ihrem Lakehouse bereitzustellen.

Ausführlichere Entscheidungsleitfaden finden Sie im Microsoft Fabric-Entscheidungsleitfaden: Wählen Sie zwischen Warehouse und Lakehouse.