Erstellen von Filtern für Miningmodelle (Analysis Services - Data Mining)
Mithilfe der datenbasierten Modellfilterung können Sie Miningmodelle erstellen, die Teilmengen der Daten einer Miningstruktur verwenden. Die Filterung ermöglicht Flexibilität bei der Entwicklung der Miningstrukturen und der Datenquellen, da Sie eine einzelne Miningstruktur auf der Grundlage einer umfassenden Datenquellensicht erstellen können. Anschließend können Sie Filter erstellen, um nur einen Teil dieser Daten zu verwenden und mehrere Modelle zu trainieren und zu testen, anstatt für jede Teilmenge der Daten eine andere Struktur und ein zugehöriges Modell zu erstellen.
Zum Beispiel definieren Sie die Datenquellensicht für die Tabelle "Kunden" und verknüpfte Tabellen. Anschließend definieren Sie eine einzelne Miningstruktur, die alle Felder enthält, die Sie benötigen. Schließlich erstellen Sie ein Modell, das nach einem bestimmten Kundenattribut gefiltert wird, z. B. "Region". Sie können einfach eine Kopie dieses Modells erstellen und nur die Filterbedingungen ändern, um ein neues Modell auf der Grundlage einer anderen Region zu erzeugen.
Die folgenden realistischen Szenarien sind einige Beispiele, in denen dieses Feature hilfreich sein kann:
Das Erstellen von separaten Modellen für diskrete Werte wie z. B. Geschlecht, Regionen usw. Ein Bekleidungsgeschäft könnte beispielsweise demografische Kundendaten verwenden, um unterschiedliche Modelle nach Geschlecht zu erstellen, auch wenn die Verkaufsdaten aus einer einzigen Datenquelle für alle Kunden stammen.
Man könnte mit Modellen experimentieren, indem man unterschiedliche Gruppierungen der gleichen Daten erstellt, beispielsweise die Altersgruppen 20-30, 20-40 oder 20-25.
Man könnte komplexe Filter für geschachtelte Tabelleninhalte erstellen, beispielsweise, dass ein Fall nur in einem Modell enthalten ist, wenn ein Kunde mindestens zwei Exemplare eines bestimmten Artikels gekauft hat.
Dieser Abschnitt erläutert, wie Filter für Miningmodelle erstellt, verwendet und verwaltet werden.
Erstellen von Modellfiltern
Es gibt folgende Möglichkeiten, um Filter zu erstellen und anzuwenden:
Verwenden Sie die Registerkarte Miningmodelle im Data Mining-Designer, um mithilfe von Dialogfeldern des Filter-Editors Bedingungen zu erstellen.
Geben Sie einen Filterausdruck direkt in die Filter-Eigenschaft des Miningmodells ein.
Legen Sie mit AMO programmgesteuerte Filterbedingungen für ein Modell fest.
Erstellen von Modellfiltern unter Verwendung des Data Mining-Designers
Sie filtern ein Modell im Data Mining-Designer, indem Sie die Filter-Eigenschaft des Miningmodells ändern. Sie können einen Filterausdruck entweder direkt im Bereich Eigenschaften eingeben, oder Sie öffnen ein Filterdialogfeld, um Bedingungen zu erstellen.
Es gibt zwei Filterdialogfelder. Mit dem ersten können Sie Bedingungen erstellen, die auf die Falltabelle angewendet werden. Wenn die Datenquelle mehrere Tabellen enthält, wählen Sie zuerst eine Tabelle und dann eine Spalte aus und legen die Operatoren und Bedingungen fest, die für die Spalte gelten sollen. Mithilfe der Operatoren AND/OR können Sie mehrere Bedingungen verknüpfen. Welche Operatoren für die Definition von Werten verfügbar sind, ist davon abhängig, ob die Spalte diskrete oder fortlaufende Werte enthält. Zum Beispiel können Sie mit fortlaufenden Werten die Operatoren greater than und less than verwenden. Für diskrete Werte können Sie jedoch nur die Operatoren = (equal to), != (not equal to) und is null verwenden.
Hinweis |
---|
Das Schlüsselwort LIKE wird nicht unterstützt. Wenn Sie mehrere diskrete Attribute einfügen möchten, müssen Sie einzelne Bedingungen erstellen und diese mithilfe des Operators OR verknüpfen. |
Wenn die Bedingungen komplex sind, können Sie das zweite Filterdialogfeld verwenden, um mit einer Tabelle gleichzeitig zu arbeiten. Wenn Sie das zweite Filterdialogfeld schließen, wird der Ausdruck ausgewertet und anschließend mit Filterbedingungen, die für andere Spalten in der gleichen Falltabelle festgelegt wurden, kombiniert.
Erstellen von Filtern für geschachtelte Tabellen
Wenn die Datenquellensicht geschachtelte Tabellen enthält, können Sie das zweite Filterdialogfeld verwenden, um Bedingungen für die Zeilen in den geschachtelten Tabellen zu erstellen.
Wenn sich beispielsweise Ihre Falltabelle auf Kunden bezieht und die geschachtelte Tabelle die Produkte zeigt, die der Kunde gekauft hat, können Sie einen Filter für Kunden erstellen, die bestimmte Artikel gekauft haben, indem Sie im Filter der geschachtelten Tabelle die folgende Syntax verwenden: [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'. [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'.
Sie können auch auf das Vorhandensein eines bestimmten Werts in der geschachtelten Tabelle filtern, indem Sie die Schlüsselwörter EXISTS oder NOT EXISTS und eine Unterabfrage verwenden. Auf diese Weise können Sie Bedingungen wie EXISTS (SELECT * FROM Products WHERE ProductName=’Water Bottle’) erstellen. Die EXISTS SELECT(<subquery>) gibt true zurück, wenn die geschachtelte Tabelle mindestens eine Zeile enthält, die den Wert Water Bottle enthält.
Sie können Bedingungen für die Falltabelle mit Bedingungen für die geschachtelte Tabelle kombinieren. Beispielsweise fügt die folgende Syntax eine Bedingung für die Falltabelle ein (Age > 30 ), eine Unterabfrage für die geschachtelte Tabelle (EXISTS (SELECT * FROM Products)) und mehrere Bedingungen für die geschachtelte Tabelle (WHERE ProductName=’Milk’ AND Quantity>2) ).
(Age > 30 AND EXISTS (SELECT * FROM Products WHERE ProductName=’Milk’ AND Quantity>2) )
Wenn Sie den Filter fertig gestellt haben, wird der Filtertext von Analysis Services ausgewertet, in einen DMX-Ausdruck übersetzt und mit dem Modell gespeichert.
Anweisungen für die Verwendung der Filterdialogfelder in Business Intelligence Development Studio finden Sie unter Vorgehensweise: Anwenden eines Filters auf ein Miningmodell.
Verwalten von Miningmodellfiltern
Durch datenbasierte Modellfilterung wird die Verwaltung der Miningstruktur und der Miningmodelle stark vereinfacht, da Sie leicht mehrere Modelle erstellen können, die auf der gleichen Struktur basieren. Sie können auch schnell Kopien vorhandener Miningmodelle erstellen und dann nur die Filterbedingung ändern. Es folgen einige Überlegungen zum Verwalten von Modellfiltern:
Um zu entscheiden, welcher Filter auf ein Modell angewendet werden soll, sehen Sie sich die Filter-Eigenschaft des Miningmodells an.
Sie können das Modell umbenennen, um den Inhalt des Filters wiederzugeben. Dies kann die Unterscheidung verwandter Modelle erleichtern.
Der Filterausdruck wird als Skript gespeichert, das zusammen mit dem zugehörigen Miningmodell oder der verschachtelten Tabelle gespeichert wird. Wenn Sie den Filtertext löschen, kann dieser nur durch die manuelle Neuerstellung des Filterausdrucks wiederhergestellt werden. Wenn Sie komplexe Filterausdrücke erstellen, sollten Sie daher eine Sicherungskopie des Filtertexts erstellen.
Immer wenn Sie einen Filterausdruck ändern oder hinzufügen, müssen Sie die Struktur und das Modell neu verarbeiten, bevor Sie die Wirkungen des Filters sehen können.
Weitere Informationen zur Filtersyntax und Beispiele für Filterausdrücke finden Sie unter Modellfiltersyntax und Beispiele (Analysis Services - Data Mining).
Informationen zur Verwendung von Modellfiltern beim Testen eines Miningmodells finden Sie unter Messen der Genauigkeit von Miningmodellen (Analysis Services – Data Mining).