Überprüfen der Genauigkeit mit Prognosegütediagrammen (Lernprogramm zu Data Mining-Grundlagen)

Auf der Registerkarte Mininggenauigkeitsdiagramm des Data Mining-Designers können Sie berechnen, wie gut die Vorhersage eines Modells ist. Außerdem können Sie die Ergebnisse eines Modells direkt mit den Ergebnissen der anderen Modelle vergleichen. Diese Vergleichsmethode wird als Prognosegütediagramm bezeichnet. In der Regel wird die Vorhersagegenauigkeit eines Miningmodells mit dem Lift oder der Klassifizierungsgenauigkeit gemessen. In diesem Lernprogramm wird nur das Prognosegütediagramm verwendet. Weitere Informationen zum Verwenden von Lift- und anderen Genauigkeitsdiagrammen finden Sie unter Tools zum Auswerten der Modellgenauigkeit (Analysis Services - Data Mining).

Im Rahmen dieses Themas führen Sie die folgenden Aufgaben aus:

  • Auswählen von Eingabedaten

  • Auswählen der Modelle, vorhersagbaren Spalten und Werte

Auswählen der Eingabedaten

Der erste Schritt beim Testen der Genauigkeit von Miningmodellen ist die Auswahl der Datenquelle, die Sie für den Test verwenden möchten. Sie überprüfen die Leistung der Modelle anhand der Testdaten und verwenden dieses anschließend mit externen Daten.

So wählen Sie das Dataset aus

  1. Wechseln Sie in Business Intelligence Development Studio im Data Mining-Designer zur Registerkarte Mininggenauigkeitsdiagramm, und wählen Sie die Registerkarte Eingabeauswahl aus.

  2. Wählen Sie im Gruppenfeld Dataset auswählen, das für das Genauigkeitsdiagramm verwendet werden soll die Option Testfälle für Miningstruktur verwenden aus, um Ihre Modelle mit den Testdaten zu testen, die Sie bei der Erstellung der Miningstruktur reserviert haben.

    Weitere Informationen zu den anderen Optionen finden Sie unter Messen der Genauigkeit von Miningmodellen (Analysis Services – Data Mining).

Auswählen der Modelle, vorhersagbaren Spalten und Werte

Im nächsten Schritt wählen Sie die Modelle aus, die Sie in das Prognosegütediagramm aufnehmen möchten. Außerdem wählen Sie die vorhersagbare Spalte aus, mit der die Modelle verglichen werden sollen, und den vorherzusagenden Wert.

HinweisHinweis

Im Feld Name der vorhersagbaren Spalte werden nur die Spalten aufgelistet, für die als Verwendungstyp Predict oder Predict Only festgelegt wurde und die den Inhaltstyp Discrete oder Discretized aufweisen.

So zeigen Sie den Lift für die Modelle an

  1. Aktivieren Sie auf der Registerkarte Eingabeauswahl des Data Mining-Designers unter Wählen Sie die vorhersagbaren Miningmodellspalten aus, die im Prognosegütediagramm angezeigt werden sollen das Kontrollkästchen Vorhersagespalten und -werte synchronisieren.

  2. Überprüfen Sie in der Spalte Name der vorhersagbaren Spalte, dass Bike Buyer für die einzelnen Modelle ausgewählt wurde.

  3. Wählen Sie in der Spalte Anzeigen jedes der Modelle aus.

    Standardmäßig werden alle Modelle in der Miningstruktur ausgewählt. Sie können angeben, dass ein Modell nicht mit aufgenommen werden soll. Behalten Sie jedoch für dieses Lernprogramm die Auswahl aller Modelle bei.

  4. Wählen Sie in der Spalte Wert vorhersagen den Wert 1 aus. Der gleiche Wert wird automatisch für jedes Modell eingegeben, das die gleiche vorhersagbare Spalte besitzt.

  5. Wählen Sie die Registerkarte Prognosegütediagramm zum Anzeigen des Prognosegütediagramms aus.

    Wenn Sie auf die Registerkarte klicken, wird eine Vorhersageabfrage für Server und Datenbank für die Miningstruktur und Eingabetabelle oder Testdaten ausgeführt. Die Ergebnisse werden im Diagramm angezeigt.

    Wenn Sie einen Wert vorhersagen-Wert eingeben, werden vom Prognosegütediagramm sowohl ein Zufallsvorhersagemodell als auch ein Idealmodell abgebildet. Die Miningmodelle, die Sie erstellt haben, liegen zwischen diesen beiden Extremen einer Zufallsvermutung und einer idealen oder perfekten Vorhersage. Jede Verbesserung der Antwortquote gegenüber der Zufallsvermutung wird als Lift betrachtet.

  6. Verwenden Sie die Legende, um die farbigen Zeilen zu identifizieren, die das Idealmodell und das Zufallsvorhersagemodell darstellen.

    Sie werden feststellen, dass im Modell TM_Decision_Tree im Vergleich zum Clustering-Modell und zum Naive Bayes-Modell der größte Lift zu verzeichnen ist.

Eine nähere Erläuterung eines ähnlichen Prognosegütediagramms wie das Diagramm, das Sie in dieser Lektion erstellt haben, finden Sie unter Prognosegütediagramm (Analysis Services - Data Mining).