Spaltenverteilungen

In Microsoft SQL Server 2005 Analysis Services (SSAS) können Sie Spaltenverteilungen in einer Miningstruktur definieren, um zu beeinflussen, wie Algorithmen die Daten in diesen Spalten verarbeiten, wenn Sie Miningmodelle erstellen. Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.

Die in Analysis Services verfügbaren Algorithmen unterstützen folgende Verteilungstypen:

Normal

Die Werte für die kontinuierliche Spalte bilden ein Histogramm, das einer Normalverteilung folgt.

Histogramm mit Normalverteilung

Log Normal

Die Werte für die kontinuierliche Spalte bilden ein Histogramm, in dem die Kurve am oberen Ende einen gedehnten Verlauf und am unteren Ende einen Schrägverlauf aufweist.

Histogramm mit Protokollnormalverteilung

Uniform

Die Werte für die kontinuierliche Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.

Histogramm mit Gleichverteilung

Weitere Informationen zu den Algorithmen, die in Analysis Services zur Verfügung stehen, finden Sie unter Data Mining-Algorithmen.

Siehe auch

Konzepte

Inhaltstypen (Data Mining)
Miningstrukturen (Analysis Services)
Diskretisierungsmethoden

Andere Ressourcen

Verteilungen (DMX)
Miningstrukturspalten

Hilfe und Informationen

Informationsquellen für SQL Server 2005