Vorhersagen von Zuordnungen (Data Mining-Lernprogramm für Fortgeschrittene)

Im Anschluss an die Verarbeitung der Modelle können Sie anhand der Informationen über Zuordnungen, die im Modell gespeichert sind, Vorhersagen erstellen. In der abschließenden Aufgabe der Lektion lernen Sie, Vorhersageabfragen auf Basis der erstellten Zuordnungsmodelle zu erstellen. In dieser Lektion wird davon ausgegangen, dass Sie mit der Verwendung des Generators für Vorhersageabfragen vertraut sind und lernen möchten, wie Vorhersageabfragen für Zuordnungsmodelle erstellt werden. Weitere Informationen zur Verwendung des Generators für Vorhersageabfragen finden Sie unter Erstellen von DMX-Vorhersageabfragen.

Erstellen einer SINGLETON-Vorhersageabfrage

Assoziative Vorhersagen erfüllen viele Zwecke, beispielsweise das Empfehlen von Elementen für Kunden oder das Herstellen von Beziehungen zwischen Produkten. Um eine Vorhersageabfrage zu erstellen, wählen Sie zuerst das gewünschte Zuordnungsmodell aus und geben dann die Eingabedaten an. Eingabedaten können aus einer externen Datenquelle wie einer Werteliste stammen, oder Sie können eine SINGLETON-Abfrage erstellen und dabei Werte bereitstellen.

In diesem Szenario erstellen Sie zunächst einige SINGLETON-Vorhersageabfragen, um eine Vorstellung der Funktionsweise von Vorhersageabfragen zu erhalten. Anschließend erstellen Sie eine Abfrage für Batchvorhersagen, mit der Empfehlungen ausgesprochen werden können, die auf den aktuellen Einkäufen von Kunden basieren.

So erstellen Sie eine Vorhersageabfrage für ein Zuordnungsmodell

  1. Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodellvorhersage.

  2. Klicken Sie im Bereich Miningmodell auf Modell auswählen. (Sie können diesen Schritt und den nächsten Schritt überspringen, wenn das richtige Modell bereits ausgewählt wurde.)

  3. Erweitern Sie im Dialogfeld Miningmodell auswählen den Knoten, der die Miningstruktur Association darstellt, und wählen Sie das Modell Association aus. Klicken Sie auf OK.

    Den Eingabebereich können Sie zunächst ignorieren.

  4. Klicken Sie im Raster unter Quelle auf die leere Zelle, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Zelle unter Feld den Eintrag PredictAssociation aus.

    Sie können auch die Predict-Funktion verwenden, um Zuordnungen vorherzusagen. Achten Sie in diesem Fall darauf, die Version der Predict-Funktion auszuwählen, die eine Tabellenspalte als Argument akzeptiert.

  5. Wählen Sie im Bereich Miningmodell die geschachtelte Tabelle vAssocSeqLineItems aus und ziehen Sie diese in das Raster zum Feld Kriterium/Argument für die PredictAssociation-Funktion.

    Das Ziehen und Ablegen von Tabellen- und Spaltennamen ermöglicht es Ihnen, komplexe Anweisungen ohne Syntaxfehler zu erstellen. Dadurch wird jedoch der aktuelle Zelleninhalt einschließlich anderer optionaler Argumente für die PredictAssociation-Funktion ersetzt. Wenn Sie die anderen Argumente anzeigen möchten, können Sie dem Raster vorübergehend eine zweite Instanz der Funktion als Referenz hinzufügen.

  6. Klicken Sie auf das Feld Kriterium/Argument, und geben Sie nach dem Tabellennamen den folgenden Text ein: ,3

    Der vollständige Text im Feld Kriterium/Argument sollte wie folgt lauten:

    [Association].[v Assoc Seq Line Items],3

  7. Klicken Sie auf die Schaltfläche Ergebnisse oben rechts im Generator für Vorhersageabfragen.

Die erwarteten Ergebnisse enthalten eine einzelne Spalte mit der Überschrift Ausdruck. Die Spalte Ausdruck enthält eine geschachtelte Tabelle mit einer einzelnen Spalte und den folgenden drei Zeilen. Da Sie keinen Eingabewert angegeben haben, stellen die Vorhersagen die wahrscheinlichsten Produktzuordnungen für das gesamte Modell dar.

Modell

Women's Mountain Shorts

Water Bottle

Touring-3000

Als Nächstes geben Sie im Bereich SINGLETON-Abfrageeingabe ein Produkt als Eingabe für die Abfrage an und zeigen die Produkte an, die am wahrscheinlichsten mit dem Element verknüpft sind.

So erstellen Sie eine SINGLETON-Vorhersageabfrage mit Eingaben für geschachtelte Tabellen

  1. Klicken Sie in der Ecke des Generators für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  2. Klicken Sie im Menü Miningmodell auf SINGLETON-Abfrage.

  3. Wählen Sie im Dialogfeld Miningmodell das Modell Association aus.

  4. Klicken Sie im Raster unter Quelle auf die leere Zelle, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Zelle unter Feld den Eintrag PredictAssociation aus.

  5. Wählen Sie im Bereich Miningmodell die geschachtelte Tabelle vAssocSeqLineItems aus und ziehen Sie diese in das Raster zum Feld Kriterium/Argument für die PredictAssociation-Funktion. Geben Sie analog zum vorherigen Verfahren nach dem Namen der geschachtelten Tabelle ,3 ein.

  6. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe neben vAssoc Seq Line Items auf das Feld Wert und anschließend auf die Schaltfläche mit den drei Punkten (...).

  7. Wählen Sie im Dialogfeld Eingabe für geschachtelte Tabelle im Bereich Schlüsselspalte die Option Touring Tire aus, und klicken Sie auf Hinzufügen.

  8. Klicken Sie auf die Schaltfläche Ergebnisse.

Die Ergebnisse zeigen nun die Vorhersagen für Produkte an, die höchstwahrscheinlich Touring Tire zugeordnet sind.

Modell

Touring Tire Tube

Sport-100

Water Bottle

Aus Ihrer Untersuchung des Modells wissen Sie jedoch bereits, dass die Produkte Touring Tire Tube und Touring Tire von Kunden häufig zusammen gekauft werden. Sie möchten vielmehr wissen, welche anderen Produkte Sie diesen Kunden empfehlen können. Sie ändern die Abfrage daher so, dass verwandte Produkte anhand der Elemente vorhergesagt werden, die sich im Einkaufskorb befinden. Außerdem ändern Sie die Abfrage, um die Wahrscheinlichkeit für jedes vorhergesagte Produkt hinzuzufügen.

So fügen Sie der Singleton-Vorhersageabfrage Eingaben und Wahrscheinlichkeiten hinzu

  1. Klicken Sie in der Ecke des Generators für Vorhersageabfragen auf die Schaltfläche Entwurf, um zum Raster für das Erstellen von Abfragen zurückzukehren.

  2. Klicken Sie im Dialogfeld SINGLETON-Abfrageeingabe neben vAssocSeqLineItems auf das Feld Wert und anschließend auf die Schaltfläche mit den drei Punkten (...).

  3. Wählen Sie im Bereich Schlüsselspalte die Option Touring Tire aus, und klicken Sie auf Hinzufügen.

  4. Klicken Sie im Raster unter Quelle auf die leere Zelle, und wählen Sie Vorhersagefunktion aus. Wählen Sie in der Zelle unter Feld den Eintrag PredictAssociation aus.

  5. Wählen Sie im Bereich Miningmodell die geschachtelte Tabelle vAssocSeqLineItems aus und ziehen Sie diese in das Raster zum Feld Kriterium/Argument für die PredictAssociation-Funktion. Geben Sie analog zum vorherigen Verfahren ,3 nach dem Namen der geschachtelten Tabelle ein.

  6. Wählen Sie im Dialogfeld Eingabe für geschachtelte Tabelle im Bereich Schlüsselspalte die Option Touring Tire Tube aus, und klicken Sie auf Hinzufügen.

  7. Klicken Sie im Raster in der Zeile für die PredictAssociation-Funktion auf das Feld Kriterium/Argument, und ändern Sie die Argumente, um das Argument INCLUDE_STATISTICS hinzuzufügen.

    Der vollständige Text im Feld Kriterium/Argument sollte wie folgt lauten:

    [Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3

  8. Klicken Sie auf die Schaltfläche Ergebnisse.

Die Ergebnisse in der geschachtelten Tabelle werden geändert, und die Vorhersagen werden mit Unterstützung und Wahrscheinlichkeit angezeigt. Weitere Informationen zum Interpretieren dieser Werte finden Sie unter Miningmodellinhalt von Zuordnungsmodellen (Analysis Services - Data Mining).

Modell

$SUPPORT

$PROBABILITY

$ADJUSTEDPROBABILITY

Sport-100

4334

0.291…

0.252…

Water Bottle

2866

0.192…

0.175…

Patchkit

2113

0.142…

0.132

Arbeiten mit Ergebnissen

Wenn Ihre Ergebnisse eine große Zahl von geschachtelten Tabellen enthalten, können Sie diese vereinfachen, um die Anzeige übersichtlicher zu gestalten. Dazu können Sie die Abfrage manuell ändern und das FLATTENED-Schlüsselwort hinzufügen.

So vereinfachen Sie geschachtelte Rowsets in einer Vorhersageabfrage

  1. Klicken Sie auf die Schaltfläche SQL in der Ecke des Generators für Vorhersageabfragen.

    Das Raster ändert sich in einen offenen Bereich, in dem Sie die DMX-Anweisung anzeigen und ändern können, die Sie mit dem Generator für Vorhersageabfragen erstellt haben.

  2. Geben Sie nach dem SELECT-Schlüsselwort FLATTENED ein.

    Der vollständige Text der Abfrage sollte wie folgt lauten:

    SELECT FLATTENED
      PredictAssociation([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,3)
    FROM
      [Association]
    NATURAL PREDICTION JOIN
    (SELECT (SELECT 'Touring Tire' AS [Model]
      UNION SELECT 'Touring Tire Tube' AS [Model]) AS [v Assoc Seq Line Items]) AS t
    
  3. Klicken Sie auf die Schaltfläche Ergebnisse oben rechts im Generator für Vorhersageabfragen.

Nach dem manuellen Bearbeiten einer Abfrage können Sie nicht mehr zur Entwurfsansicht zurückkehren, ohne dass Ihre Änderungen verloren gehen. Wenn Sie die Abfrage speichern möchten, können Sie die manuell erstellte DMX-Anweisung in eine Textdatei kopieren. Wenn Sie zur Entwurfsansicht zurückkehren, wird die Abfrage auf die letzte gültige Version in der Entwurfsansicht zurückgesetzt.

Erstellen von mehreren Vorhersagen

Angenommen, Sie möchten die besten Vorhersagen für einzelne Kunden auf Basis ihrer vergangenen Käufe erstellen. Als Eingabe für eine solche Vorhersageabfrage können Sie externe Daten wie Tabellen mit der Kunden-ID und den letzten Produktkäufen verwenden. Diese Datentabellen müssen bereits als Analysis Services-Datenquellensichten definiert worden sein, und die Eingabedaten müssen Falltabellen und geschachtelte Tabellen analog zu den Modelltabellen enthalten. Die Tabellen müssen nicht den gleichen Namen, jedoch eine ähnliche Struktur aufweisen. In diesem Lernprogramm verwenden Sie die ursprünglichen Tabellen, die zum Trainieren des Modells verwendet wurden.

So ändern Sie die Eingabemethode für die Vorhersageabfrage

  1. Wählen Sie im Menü Miningmodell erneut SINGLETON-Abfrage aus, um das Häkchen zu entfernen.

  2. Es wird eine Warnmeldung angezeigt, die Sie darüber informiert, dass die SINGLETON-Abfrage verloren geht. Klicken Sie auf Ja.

    Der Name des Eingabedialogfelds ändert sich in Eingabetabelle(n) auswählen.

Da Sie eine Vorhersageabfrage erstellen möchten, die die Customer ID sowie eine Liste der Produkte als Eingabe bereitstellt, fügen Sie die Kundentabelle als Falltabelle hinzu und die Tabelle mit den von Kunden getätigten Käufen als geschachtelte Tabelle. Anschließend fügen Sie Vorhersagefunktionen hinzu, um Empfehlungen zu erstellen.

So erstellen Sie eine Vorhersageabfrage mit Eingaben für geschachtelte Tabellen

  1. Wählen Sie im Bereich Miningmodell das Modell Association Filtered aus.

  2. Klicken Sie im Dialogfeld Eingabetabelle(n) auswählen auf Falltabelle auswählen.

  3. Wählen Sie im Dialogfeld Tabelle auswählen für Datenquelle AdventureWorksDW2008 aus. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag vAssocSeqOrders aus, und klicken Sie dann auf OK.

    Die Tabelle vAssocSeqOrders wird dem Bereich hinzugefügt.

  4. Klicken Sie im Dialogfeld Eingabetabelle(n) auswählen auf Geschachtelte Tabelle auswählen.

  5. Wählen Sie im Dialogfeld Tabelle auswählen für Datenquelle AdventureWorksDW2008 aus. Wählen Sie in der Liste Tabellen-/Sichtname den Eintrag vAssocSeqLineItems aus, und klicken Sie dann auf OK.

    Die Tabelle vAssocSeqLineItems wird dem Bereich hinzugefügt.

  6. Ziehen Sie im Dialogfeld Geschachtelte Verknüpfung angeben das OrderNumber-Feld aus der Falltabelle und legen Sie es im OrderNumber-Feld in der geschachtelten Tabelle ab.

    Sie können auch auf Beziehung hinzufügen klicken und die Beziehung durch Auswählen von Spalten aus einer Liste erstellen.

  7. Vergewissern Sie sich, dass im Dialogfeld Beziehung angeben eine korrekte Zuordnung der OrderNumber-Felder vorgenommen wurde, und klicken Sie auf OK.

  8. Klicken Sie auf OK, um das Dialogfeld Geschachtelte Verknüpfung angeben zu schließen.

    Die Falltabelle und die geschachtelte Tabelle werden im Entwurfsbereich aktualisiert, um die Verknüpfungen zwischen den externen Datenspalten und den Spalten im Modell anzuzeigen. Wenn fehlerhafte Beziehungen erstellt werden, können Sie mit der rechten Maustaste auf die Verknüpfungslinie klicken und Verbindungen ändern auswählen, um die Spaltenzuordnung zu bearbeiten. Sie können auch mit der rechten Maustaste auf die Verknüpfungslinie klicken und Löschen auswählen, um die Beziehung vollständig zu entfernen.

  9. Fügen Sie dem Raster eine neue Zeile hinzu. Wählen Sie vAssocSeqOrders-Tabelle als Quelle aus. Wählen Sie CustomerKey als Feld aus.

  10. Fügen Sie dem Raster eine neue Zeile hinzu. Wählen Sie vAssocSeqOrders-Tabelle als Quelle aus. Wählen Sie Region als Feld aus.

  11. Fügen Sie dem Raster eine neue Zeile hinzu. Wählen Sie Vorhersagefunktion als Quelle und PredictAssociationals Feld aus.

  12. Ziehen Sie vAssocSeqLineItems in das Feld Kriterium/Argument der Zeile PredictAssociation. Klicken Sie auf das Ende des Felds Kriterium/Argument, und geben Sie folgenden Text ein: INCLUDE_STATISTICS,3

    Der vollständige Text im Feld Kriterium/Argument sollte wie folgt lauten: [Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3

  13. Klicken Sie auf die Schaltfläche Ergebnis, um die Vorhersagen für die einzelnen Kunden anzuzeigen.

Sie können versuchen, eine ähnliche Vorhersageabfrage für mehrere Modelle zu erstellen, um mögliche Auswirkungen von Filteränderungen auf die Vorhersageergebnisse zu überprüfen. Weitere Informationen über das Erstellen von Vorhersagen und anderen Abfragen finden Sie unter Abfragen eines Zuordnungsmodells (Analysis Services - Data Mining).