Grundlegendes zur V-Order für Microsoft Fabric Warehouse

Gilt für: Warehouse in Microsoft Fabric

Das Warehouse in Microsoft Fabric-Speicher verwendet das Delta Lake-Tabellenformat für alle Benutzerdaten. Neben Optimierungen des Delta-Formats wendet ein Warehouse Optimierungen auf den Speicher an, um eine schnellere Abfrageleistung in Analyseszenarien bereitzustellen und gleichzeitig die Einhaltung des Parquet-Formats aufrechtzuerhalten. In diesem Artikel werden die V-Order-Schreiboptimierung, die Vorteile und die Steuerung behandelt.

Was ist mit V-Reihenfolge gemeint?

Die V-Reihenfolge ist eine Schreibzeitoptimierung für das Parquet-Dateiformat, die blitzschnelle Lesevorgänge unter Microsoft Fabric-Computemodulen wie Power BI, SQL, Spark und anderen ermöglicht.

Power BI- und SQL-Engines verwenden Microsoft Verti-Scan-Technologie und in V-Reihenfolge angeordnete Parquet-Dateien, um nahezu In-Memory-Datenzugriffszeiten zu erreichen. Spark und andere Computemodule, die nicht von Verti-Scan stammen, profitieren mit durchschnittlich um 10 % schnelleren Lesevorgängen ebenfalls von den in V-Reihenfolge angeordneten Dateien, wobei in einigen Szenarien Lesevorgänge bis zu 50 % schneller sind.

V-Order funktioniert, indem spezielle Sortier-, Zeilengruppenverteilung, Wörterbuchcodierung und Komprimierung auf Parquet-Dateien angewendet werden. Daher benötigen Computemodule weniger Netzwerk-, Datenträger- und CPU-Ressourcen, um Daten aus dem Speicher zu lesen, wodurch Kosteneffizienz und Leistung erzielt werden. Das Format ist zu 100% mit dem Open-Source-Parquet-Format kompatibel. Alle Parquet-Engines können es als reguläre Parquet-Dateien lesen.

Überlegungen zur Leistung

Beachten Sie Folgendes, bevor Sie sich für die Deaktivierung von V-Order entscheiden:

  • Der Microsoft Fabric Direct Lake-Modus hängt von V-Order ab.
  • Im Warehouse kann die Auswirkung von V-Order auf die Leistung abhängig von Ihren Tabellenschemas, Datenvolumes, Abfrage- und Aufnahmemustern variieren.
  • Stellen Sie sicher, dass Sie testen, wie V-Order die Leistung der Datenerfassung und Ihrer Abfragen beeinflusst, bevor Sie sich für die Deaktivierung entscheiden. Erwägen Sie, eine Kopie Ihres Test-Warehouse mithilfe der Quellcodeverwaltung zu erstellen, die V-Order für die Kopie zu deaktivieren und Datenerfassung- und Abfrageaufgaben auszuführen, um die Leistungsauswirkungen zu testen.

Szenarien, in denen V-Order möglicherweise nicht von Vorteil ist

Berücksichtigen Sie die Auswirkungen von V-Order auf die Leistung, bevor Sie entscheiden, ob die Deaktivierung von V-Order für Sie geeignet ist.

Achtung

Derzeit kann das Deaktivieren von V-Order nur auf Warehouse-Ebene erfolgen, und es ist unwiderruflich: Sobald sie deaktiviert wurde, kann sie nicht mehr aktiviert werden. Benutzer müssen die Leistung berücksichtigen, wenn sie sich für die Deaktivierung von V-Order in Fabric Warehouse entscheiden.

Das Deaktivieren von V-Order kann für schreibintensive Warehouses nützlich sein, z. B. für Warehouses, die als Teil eines Datenerfassungsprozesses für Stagingdaten vorgesehen sind. Stagingtabellen werden häufig gelöscht und neu erstellt (oder abgeschnitten), um neue Daten zu verarbeiten. Diese Stagingtabellen können dann nur einmal oder zweimal gelesen werden, was die hinzugefügte Aufnahmezeit durch Anwenden der V-Order möglicherweise nicht rechtfertigen kann. Durch Deaktivieren der V-Order und Reduzierung der Zeit für die Erfassung von Daten kann die Gesamtzeit für die Verarbeitung von Daten während der Aufnahmeaufträge verringert werden. In diesem Fall sollten Sie das Staging-Warehouse aus Ihrem benutzerseitigen Haupt-Warehouse segmentieren, damit die Analyseabfragen und Power BI von V-Order profitieren können.