Zusammenführen von Analysis Services-Partitionen

Bevor Sie Partitionen zusammenführen, sollten Sie verstehen, welches Szenario sich für das Verwenden und Zusammenführen von mehreren Partitionen am besten eignet. Wenn die Zusammenführung nicht ordnungsgemäß durchgeführt wird, kann es aufgrund von Problemen mit doppelt zählenden Faktendaten zu falschen Ergebnissen bei der nachfolgenden Analyse kommen. Unabhängig davon, wie sorgfältig oder gut durchdacht Ihre Strategie zum Zusammenführen von Partitionen ist, sollten Sie die Legacydaten in regelmäßigen Abständen sichern.

Übliche Szenarien zum Zusammenführen von Partitionen

Die am häufigsten vorkommende Konfiguration für die Verwendung von Partitionen umfasst die Trennung von Daten über die Dimension der Zeit. Die den einzelnen Partitionen zugeordnete Zeitgranularität richtet sich nach den für das Projekt geltenden Geschäftsanforderungen. So kann z. B. eine Unterteilung nach Jahren und für das laufende Jahr eine Unterteilung nach Monaten erfolgen. Möglich ist auch eine Unterteilung nach Tagen, wobei der aktuelle Tag durch die an dem Tag bereits vergangenen Stunden dargestellt wird. Die üblichste Konfiguration ist die Partitionierung nach Jahr, wobei das laufende Jahr die Monate bis zum aktuellen Datum enthält, sowie eine separate Partition für den aktiven Monat, in die regelmäßig die neuen Daten aufgenommen werden. Wenn der aktive Monat abgeschlossen ist, wird diese Partition wieder mit den Monaten in der Partition für das laufende Jahr zusammengeführt, und der Prozess wird fortgesetzt. Bis zum Ende des Jahres entsteht auf diese Weise eine vollständige neue Jahrespartition.

Gründe für das Partitionieren von Daten

Neben reinen Überlegungen zur Datengröße wird die zuvor beschriebene Partitionskonfiguration häufig verwendet, weil sich damit der zeiteffektivste Entwurf für eine Datenspeicherung in Analysis Services realisieren lässt. So kann z. B. die Verarbeitung eines Cubes mit den Umsatzdaten eines Unternehmens für ein Jahr einen ganzen Tag dauern. Wenn das Jahr 2004 abgeschlossen ist und die Daten für dieses Jahr verarbeitet sind, ist es nicht mehr effizient, neue Daten hinzuzufügen, da der Zeitaufwand für die Aktualisierung aller Aggregationen zu hoch wäre. Am effektivsten ist es, die Daten für jedes Jahr auf eine eigene Partition auszulagern.