Creazione di filtri per i modelli di data mining (Analysis Services - Data mining)

I filtri dei modelli basati sui dati consentono di creare modelli di data mining che utilizzano subset di dati in una struttura di data mining. I filtri garantiscono grande flessibilità per la progettazione di strutture di data mining e origini dati, poiché è possibile creare una sola struttura di data mining sulla base di una vista origine dati completa. Sarà quindi possibile creare filtri per utilizzare solo una parte dei dati per il training e il testing di una varietà di modelli, anziché creare una struttura diversa e i relativi modelli per ciascun subset di dati.

Ad esempio, definire la vista origine dati nella tabella Customers e nelle tabelle correlate. Quindi, definire una sola struttura di data mining che include tutti i campi necessari. Infine, creare un modello filtrato su un determinato attributo del cliente, ad esempio la regione. È quindi possibile creare facilmente una copia di quel modello e modificare solo la condizione di filtro per generare un nuovo modello basato su una regione diversa.

Alcuni scenari reali in cui è possibile trarre vantaggio da questa funzionalità sono i seguenti:

  • Creazione di modelli separati per valori discreti come ad esempio sesso, regione e così via. Ad esempio, un negozio di abbigliamento potrebbe utilizzare le informazioni demografiche sui clienti per creare modelli separati per sesso, anche se i dati di vendita provengono da una sola origine dati per tutti i clienti.

  • Esperimenti con i modelli tramite la creazione e il testing di più raggruppamenti degli stessi dati, ad esempio età 20-30 rispetto a età 20-40 ed età 20-25.

  • Specifica di filtri complessi su contenuto di tabelle nidificate, ad esempio la richiesta di inclusione di un case nel modello solo se il cliente ha acquistato almeno due unità di un determinato articolo.

In questa sezione vengono descritti la creazione, l'utilizzo e la gestione dei filtri sui modelli di data mining.

Creazione di filtri dei modelli

È possibile creare e applicare filtri nei seguenti modi:

  • Utilizzando la scheda Modelli di data mining nella Progettazione modelli di data mining per creare condizioni con l'aiuto delle finestre di dialogo dell'editor filtri.

  • Digitando un'espressione di filtro direttamente nella proprietà Filter del modello di data mining.

  • Impostando a livello di codice delle condizioni di filtro in un modello tramite AMO.

Creazione di filtri dei modelli utilizzando la Progettazione modelli di data mining

Filtrare un modello nella Progettazione modelli di data mining modificando la proprietà Filter del modello di data mining. È possibile digitare direttamente un'espressione di filtro nel riquadro Proprietà o è possibile aprire una finestra di dialogo del filtro per creare le condizioni.

Sono disponibili due finestre di dialogo del filtro. La prima consente di creare le condizioni applicate alla tabella del case. Se l'origine dati contiene più tabelle, selezionare in primo luogo una tabella, quindi selezionare una colonna e specificare gli operatori e le condizioni applicabili alla colonna. È possibile collegare più condizioni utilizzando gli operatori AND/OR. Gli operatori disponibili per la definizione dei valori variano a seconda che la colonna contenga valori discreti o continui. Con i valori continui, ad esempio, è possibile utilizzare gli operatori greater than e less than. mentre con i valori discreti è possibile utilizzare solo gli operatori = (equal to), != (not equal to)e is null.

[!NOTA]

La parola chiave LIKE non è supportata. Se si desidera includere più attributi discreti, è necessario creare condizioni distinte e collegarle utilizzando l'operatore OR.

Se le condizioni sono complesse, è possibile aprire la seconda finestra di dialogo del filtro per utilizzare una tabella alla volta. Quando si chiude la seconda finestra di dialogo del filtro, l'espressione viene valutata e quindi combinata con le condizioni di filtro impostate nelle altre colonne nella tabella del case.

Creazione di filtri nelle tabelle nidificate

Se la vista origine dati contiene tabelle nidificate, è possibile utilizzare la seconda finestra di dialogo del filtro per creare condizioni sulle righe nelle tabelle nidificate.

Ad esempio, se la tabella del case è riferita ai clienti e nella tabella nidificata vengono mostrati i prodotti che un cliente ha acquistato, è possibile creare un filtro per clienti che hanno acquistato determinati articoli utilizzando la sintassi seguente nel filtro della tabella nidificata: [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'. [ProductName]=’Water Bottle’ OR ProductName=’Water Bottle Cage'.

È anche creare un filtro in base all'esistenza di un determinato valore utilizzando le parole chiave EXISTS o NOT EXISTS e una sottoquery. Ciò consente di creare condizioni come EXISTS (SELECT * FROM Products WHERE ProductName=’Water Bottle’). EXISTS SELECT(<subquery>) restituisce true se la tabella nidificata contiene almeno una riga che include il valore Water Bottle.

È possibile combinare condizioni nella tabella del case con le condizioni nella tabella nidificata. Ad esempio, nella sintassi seguente è inclusa una condizione nella tabella del case (Age > 30 ), una sottoquery nella tabella nidificata (EXISTS (SELECT * FROM Products)) e più condizioni nella tabella nidificata (WHERE ProductName=’Milk’ AND Quantity>2)).

(Age > 30 AND EXISTS (SELECT * FROM Products WHERE ProductName=’Milk’  AND Quantity>2) )

Quando la creazione del filtro è terminata, il testo del filtro viene valutato da Analysis Services, tradotto a un'espressione DMX e quindi salvato con il modello.

Per istruzioni sull'utilizzo delle finestre di dialogo del filtro in Business Intelligence Development Studio, vedere Procedura: Applicazione di un filtro a un modello di data mining.

Gestione dei filtri dei modelli di data mining

I filtri dei modelli basati sui dati semplificano in modo significativo la gestione delle strutture e dei modelli di data mining, in quanto consentono di creare con facilità più modelli basati sulla stessa struttura. È inoltre possibile creare rapidamente copie di modelli di data mining esistenti e quindi modificare solo la condizione di filtro. Di seguito sono riportate alcune considerazioni sulla gestione dei filtri dei modelli:

  • Per determinare il filtro applicato a un modello, visualizzare la proprietà Filter del modello di data mining.

  • È possibile rinominare il modello per riflettere il contenuto del filtro, semplificando il riconoscimento di modelli correlati.

  • L'espressione di filtro viene salvata come script che viene a sua volta archiviato con il modello di data mining o la tabella nidificata associati. Se si elimina il testo del filtro, tale testo può essere ripristinato solo ricreando manualmente l'espressione di filtro. Pertanto, se si creano espressioni di filtro complesse, è necessario creare una copia di backup del testo del filtro.

  • Ogni volta che si modifica o si aggiunge un'espressione di filtro, è necessario rielaborare la struttura e il modello prima che sia possibile visualizzare gli effetti del filtro.

Per ulteriori informazioni sulla sintassi del filtro ed esempi di espressioni di filtro, vedere Sintassi ed esempi di filtri dei modelli (Analysis Services – Data mining).

Per informazioni sull'utilizzo di filtri dei modelli quando si esegue il test di un modello di data mining, vedere Misurazione dell'accuratezza di un modello di data mining (Analysis Services - Data mining)