Artikel
03/30/2012

Verteilungen (DMX)

In Microsoft SQL Server Analysis Services können Sie den Inhalt von Spalten in einer Miningstruktur definieren, um zu beeinflussen, wie Algorithmen die Daten in diesen Spalten verarbeiten, wenn Sie Miningmodelle erstellen.Für einige Algorithmen ist es hilfreich, vor dem Verarbeiten des Modells für jede kontinuierliche Spalte die Verteilung zu definieren, wenn für die Spalten bekannt ist, dass sie normal verteilte Werte enthalten. Wenn Sie die Verteilungen nicht definieren, liefern die sich ergebenden Miningmodelle möglicherweise ungenauere Vorhersagen, da die Algorithmen weniger Informationen zum Interpretieren der Daten haben.

Microsoft Data Mining-Algorithmen unterstützen die folgenden Verteilungstypen:

NORMAL
Die Werte für die kontinuierliche Spalte bilden ein Histogramm, das einer gaußschen Normalverteilung folgt.
Log Normal
Die Werte für die kontinuierliche Spalte bilden ein Histogramm, bei dem der Logarithmus der Werte normal verteilt ist.
UNIFORM
Die Werte für die kontinuierliche Spalte bilden eine flache Kurve, in der alle Werte gleich wahrscheinlich sind.

Weitere Informationen zu Microsoft Data Mining-Algorithmen finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining). Algorithmenanbieter von Drittanbietern unterstützen möglicherweise weitere Verteilungstypen. Über das SUPPORTED_MODELING_FLAGS-Schemarowset können Sie ermitteln, welche Verteilungstypen ein Algorithmus unterstützt.

Weitere Informationen zu Verteilungstypen finden Sie unter Spaltenverteilungen (Data Mining).