Vorgehensweise: Erstellen von Berichten für die Kreuzvalidierung
Um einen Bericht für die Kreuzvalidierung in SQL Server Analysis Services zu erstellen, müssen Sie Schritte ausführen, die sich geringfügig von den Verfahren für andere Arten von Genauigkeitsdiagrammen unterscheiden. Dies liegt daran, dass ein Bericht für die Kreuzvalidierung keine externen Daten verwendet, sondern nur die ursprünglichen Daten, die zum Trainieren des Modells verwendet werden. Daher müssen Sie keine Datenquelle auswählen oder Spalten der Datenquelle den Spalten im Miningmodell zuordnen.
Die folgende Prozedur beschreibt die Schritte zur Konfiguration und Generierung eines Berichts für die Kreuzvalidierung. Allgemeine Informationen über die Kreuzvalidierung finden Sie unter Übergreifende Überprüfung (Analysis Services - Data Mining).
Informationen zum Erstellen anderer Arten von Genauigkeitsdiagrammen finden Sie unter Vorgehensweise: Erstellen eines Genauigkeitsdiagramms für ein Miningmodell.
Hinweis |
---|
Nur Modelle, die mit der gerade ausgewählten Struktur verknüpft werden, sind für die Kreuzvalidierung verfügbar. Wenn die Struktur Modelle unterstützt, die über verschiedene vorhersagbare Attribute verfügen oder wenn die Struktur eine Kombination aus Cluster- und Nicht-Clustermodellen unterstützt, müssen Sie separate Berichte für die einzelnen vorhersagbaren Ausgaben erstellen oder separate Berichte für die Cluster- und Nicht-Clustermodelle. |
So wählen Sie eine Miningstruktur zur Kreuzvalidierung aus
Öffnen Sie den Data Mining-Designer in Business Intelligence Development Studio.
Öffnen Sie im Projektmappen-Explorer die Datenbank, die die Struktur oder das Modell enthält, für das Sie einen Bericht erstellen möchten.
Doppelklicken Sie im Data Mining-Designer auf die Miningstruktur, um die Struktur und die zugehörigen Modelle zu öffnen.
Klicken Sie auf die Registerkarte Mininggenauigkeitsdiagramm.
Klicken Sie auf die Registerkarte Kreuzvalidierung.
So legen Sie Kreuzvalidierungsoptionen fest
Klicken Sie auf der Registerkarte Kreuzvalidierung für Aufteilungsanzahl auf den Pfeil nach unten, um eine Zahl zwischen 1 und 10 auszuwählen. Der Standardwert lautet 10.
Die Aufteilungsanzahl stellt die Anzahl von Partitionen dar, die innerhalb des ursprünglichen Datasets erstellt werden. Wenn Sie die Aufteilungsanzahl auf 1 festgelegt haben, wird der Trainingssatz ohne Partitionierung verwendet.
Klicken Sie für Zielattribut auf den Pfeil nach unten, und wählen Sie eine Spalte aus der Liste aus. Wenn das Modell ein Clustermodell ist, wählen Sie #Cluster, um anzugeben, dass das Modell über kein vorhersagbares Attribut verfügt.
Sie können nur ein vorhersagbares Attribut pro Bericht auswählen. Standardmäßig sind alle zugehörigen Modelle, die über das gleiche vorhersagbare Attribut verfügen, im Bericht enthalten.
Geben Sie für Maximale Anzahl von Fällen eine Zahl ein, die groß genug ist, um eine repräsentative Stichprobe von Daten bereitzustellen, wenn die Daten auf die angegebene Anzahl von Aufteilungen aufgeteilt wird. Wenn Sie eine Zahl angeben, die größer ist als die Anzahl der tatsächlichen Fälle im Trainingssatz des Modells, werden alle Fälle verwendet.
Wenn der Trainingsdatensatz sehr groß ist, können Sie über den unter Maximale Anzahl von Fällen eingegebenen Wert die Gesamtzahl der verarbeiteten Fälle einschränken. Der Bericht kann so schneller beendet werden. Sie sollten jedoch keinen zu kleinen Wert für Maximale Anzahl von Fällen eingeben, da ansonsten möglicherweise nicht genügend Daten zur Kreuzvalidierung zur Verfügung stehen.
Geben Sie optional für Zielstatus den Wert des vorhersagbaren Attributs ein, das Sie modellieren möchten. Beispiel: Die Spalte 'Fahrradkäufer' kann zwei mögliche Werte annehmen, 1 (Ja) und 2 (Nein). Sie können den Wert 1 eingeben, um auf die Genauigkeit des Modells für Fahrradkäufer einzugehen.
Hinweis Wenn Sie keinen Wert eingeben, ist die Option Zielschwellenwert nicht verfügbar, und auf das Modell wird für alle möglichen Werte des vorhersagbaren Attributs zugegriffen.
Geben Sie optional für Zielschwellenwert eine Dezimalzahl zwischen 0 und 1 ein, um anzugeben, welche Mindestwahrscheinlichkeit eine Vorhersage erreichen muss, damit sie als genau gelten kann.
Weitere Informationen zum Festlegen von Schwellenwerten für Wahrscheinlichkeiten finden Sie unter Bericht für die Kreuzvalidierung (Analysis Services – Data Mining).
Klicken Sie auf Ergebnisse abrufen.
So drucken Sie den Bericht
Klicken Sie auf der Registerkarte Kreuzvalidierung mit der rechten Maustaste auf den abgeschlossenen Bericht.
Wählen Sie aus dem Kontextmenü die Option Drucken oder Seitenansicht, um zunächst den Bericht zu überprüfen.
So erstellen Sie eine Kopie des Berichts in Microsoft Excel
Klicken Sie auf der Registerkarte Kreuzvalidierung mit der rechten Maustaste auf den abgeschlossenen Bericht.
Wählen Sie im Kontextmenü die Option Alles auswählen.
Klicken Sie mit der rechten Maustaste auf den ausgewählten Text, und wählen Sie Kopieren.
Fügen Sie die Auswahl in eine geöffnete Excel-Arbeitsmappe ein. Wenn Sie Einfügen verwenden, wird der Bericht als HTML in Excel eingefügt. Auf diese Weise werden Zeilen- und Spaltenformatierung beibehalten. Wenn Sie den Bericht mit den Optionen für Inhalte einfügen für Text oder Unicode-Text einfügen, wird der Bericht im nach Zeilen getrennten Format eingefügt.
Siehe auch