Lektion 4: Durchsuchen des Bike Buyer-Miningmodells
In dieser Lektion durchsuchen Sie mithilfe der SELECT (DMX)-Anweisung den Inhalt der Decision Tree- und Clustering-Miningmodelle, die Sie in Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur erstellt haben.
Die in einem Miningmodell enthaltenen Spalten entsprechen nicht den Spalten, die durch die Miningstruktur definiert werden; stattdessen handelt es sich um eine bestimmte Gruppe von Spalten, die die vom Algorithmus ermittelten Tendenzen und Muster beschreiben. Diese Miningmodellspalten werden im DMSCHEMA_MINING_MODEL_CONTENT Rowset-Schemarowset beschrieben. Beispielsweise enthält die MODEL_NAME-Spalte im Schemarowset für den Inhalt den Namen des Miningmodells. Für ein Clustering-Miningmodell enthält die NODE_CAPTION-Spalte den Namen des jeweiligen Clusters und die NODE_DESCRIPTION-Spalte eine Beschreibung der Merkmale des jeweiligen Clusters. Sie können diese Spalten durchsuchen, indem Sie die SELECT FROM <model>.CONTENT-Anweisung in DMX verwenden. Sie können diese Anweisung auch verwenden, um die zum Erstellen des Miningmodells verwendeten Daten zu durchsuchen. Drillthrough muss in der Miningstruktur aktiviert sein, um diese Anweisung verwenden zu können. Weitere Informationen zu dieser Anweisung finden Sie unter SELECT FROM <model>.CASES (DMX).
Sie können auch alle Statuswerte einer diskreten Spalte zurückgeben, indem Sie die SELECT DISTINCT-Anweisung verwenden. Wenn Sie diesen Vorgang beispielsweise für eine Geschlechterspalte durchführen, gibt die Abfrage male und female zurück.
Lektionsaufgaben
Im Rahmen dieser Lektion führen Sie die folgenden Aufgaben aus:
Durchsuchen des Inhalts der Miningmodelle
Zurückgeben der Fälle aus den Quelldaten, die zum Trainieren der Miningmodelle verwendet wurden
Prüfen der verschiedenen Status, die für eine bestimmte diskrete Spalte zur Verfügung stehen
Zurückgeben des Inhalts eines Miningmodells
In dieser Lektion verwenden Sie die SELECT FROM <model>.CONTENT (DMX)-Anweisung, um den Inhalt des Clusteringmodells zurückzugeben.
Es folgt ein allgemeines Beispiel für die SELECT FROM <model>.CONTENT-Anweisung:
SELECT <select list> FROM [<mining model>].CONTENT
WHERE <where clause>
Die erste Codezeile definiert die vom Inhalt des Miningmodells zurückzugebenden Spalten und das Miningmodell, dem sie zugeordnet sind:
SELECT <select list> FROM [<mining model].CONTENT
Die .CONTENT-Klausel neben dem Namen des Miningmodells gibt an, dass Inhalt aus dem Miningmodell zurückgegeben werden soll. Weitere Informationen zu den Spalten im Miningmodell finden Sie unter DMSCHEMA_MINING_MODEL_CONTENT-Rowset.
Optional können Sie die letzte Codezeile zum Filtern der von der Anweisung zurückgegebenen Ergebnisse verwenden:
WHERE <where clause>
Wenn Sie beispielsweise die Ergebnisse der Abfrage auf die Cluster beschränken möchten, die eine hohe Anzahl von Fällen enthalten, können Sie der SELECT-Anweisung die folgende WHERE-Klausel hinzufügen:
WHERE NODE_SUPPORT > 100
Weitere Informationen zur WHERE-Anweisung finden Sie unter SELECT (DMX).
So geben Sie den Inhalt des Clustering-Miningmodells zurück
Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX.
Der Abfrage-Editor wird mit einer neuen leeren Abfrage geöffnet.
Kopieren Sie das allgemeine Beispiel der SELECT FROM <model>.CONTENT-Anweisung in die leere Abfrage.
Ersetzen Sie Folgendes:
<select list>
durch:
Sie können * auch durch eine Liste mit beliebigen Spalten aus dem DMSCHEMA_MINING_MODEL_CONTENT-Rowset ersetzen.
Ersetzen Sie Folgendes:
[<mining model>]
durch:
[Clustering]
Die gesamte Anweisung sollte wie folgt aussehen:
SELECT * FROM [Clustering].CONTENT
Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.
Wechseln Sie im Dialogfeld Speichern unter in den entsprechenden Ordner, und geben Sie der Datei den Namen SELECT_CONTENT.dmx.
Klicken Sie auf der Symbolleiste auf die Schaltfläche Ausführen.
Die Abfrage gibt den Inhalt des Miningmodells zurück.
Verwenden von Drillthrough
Im nächsten Schritt verwenden Sie die Drillthroughanweisung, um eine Stichprobe der Fälle zurückzugeben, die zum Trainieren des Decision Tree-Miningmodells verwendet wurden. In dieser Lektion verwenden Sie die SELECT FROM <model>.CASES (DMX)-Anweisung, um den Inhalt des Decision Tree-Modells (Entscheidungsstruktur-Modell) zurückzugeben.
Es folgt ein allgemeines Beispiel für die SELECT FROM <model>.CASES-Anweisung:
SELECT <select list>
FROM [<mining model>].CASES
WHERE IsInNode('<node id>')
Die erste Codezeile definiert die aus den Quelldaten zurückzugebenden Spalten sowie das Miningmodell, in dem sie enthalten sind:
SELECT <select list> FROM [<mining model>].CASES
Die .CASES-Klausel gibt an, dass Sie eine Drillthroughabfrage durchführen. Um Drillthrough verwenden zu können, müssen Sie beim Erstellen des Miningmodells Drillthrough aktivieren.
Die letzte Codezeile ist optional und gibt den Knoten des Miningmodells an, aus dem Sie Fälle anfordern:
WHERE IsInNode('<node id>')
Weitere Informationen zur WHERE-Anweisung mit IsInNode finden Sie unter SELECT FROM <model>.CASES (DMX).
So geben Sie die Fälle zurück, die zum Trainieren des Miningmodells verwendet wurden
Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX.
Der Abfrage-Editor wird mit einer neuen leeren Abfrage geöffnet.
Kopieren Sie das allgemeine Beispiel der SELECT FROM <model>.CASES-Anweisung in die leere Abfrage.
Ersetzen Sie Folgendes:
<select list>
durch:
Sie können * auch durch eine Liste mit beliebigen Spalten aus den Quelldaten ersetzen (z. B. [Bike Buyer]).
Ersetzen Sie Folgendes:
[<mining model>]
durch:
[Decision Tree]
Die gesamte Anweisung sollte wie folgt aussehen:
SELECT * FROM [Decision Tree].CASES
Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.
Wechseln Sie im Dialogfeld Speichern unter in den entsprechenden Ordner, und geben Sie der Datei den Namen SELECT_DRILLTHROUGH.dmx.
Klicken Sie auf der Symbolleiste auf die Schaltfläche Ausführen.
Die Abfrage gibt die Quelldaten zurück, die zum Trainieren des Decision Tree-Miningmodells verwendet wurden.
Zurückgeben der Status einer diskreten Miningmodellspalte
Im nächsten Schritt verwenden Sie die SELECT DISTINCT-Anweisung, um die möglichen verschiedenen Status in der angegebenen Miningmodellspalte zurückzugeben.
Die folgende Zeile ist ein allgemeines Beispiel für die SELECT DISTINCT-Anweisung:
SELECT DISTINCT [<column>]
FROM [<mining model>]
Die erste Codezeile definiert die Miningmodellspalten, für die die Status zurückgegeben werden:
SELECT DISTINCT [<column>]
Sie müssen DISTINCT einschließen, damit alle Status der Spalte zurückgegeben werden. Wenn Sie DISTINCT nicht angeben, wird die Anweisung zu einer Abkürzung für eine Vorhersage und gibt den wahrscheinlichsten Status der angegebenen Spalte zurück. Weitere Informationen finden Sie unter SELECT (DMX).
So geben Sie die Status einer diskreten Spalte zurück
Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX.
Der Abfrage-Editor wird mit einer neuen leeren Abfrage geöffnet.
Kopieren Sie das allgemeine Beispiel der SELECT-Anweisung in die leere Abfrage.
Ersetzen Sie Folgendes:
[<column,name>
durch:
[Bike Buyer]
Ersetzen Sie Folgendes:
[<mining model>]
durch:
[Decision Tree]
Die gesamte Anweisung sollte wie folgt aussehen:
SELECT DISTINCT [Bike Buyer] FROM [Decision Tree]
Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.
Wechseln Sie im Dialogfeld Speichern unter in den entsprechenden Ordner, und geben Sie der Datei den Namen SELECT_DISCRETE.dmx.
Klicken Sie auf der Symbolleiste auf die Schaltfläche Ausführen.
Die Abfrage gibt die möglichen Status der Bike Buyer-Spalte zurück.
In der nächsten Lektion sagen Sie mithilfe des Decision Tree-Miningmodells vorher, ob potenzielle Kunden ein Fahrrad kaufen werden.