Esercitazione intermedia sul data mining (Analysis Services - Data mining)
Microsoft Analysis Services offre un ambiente integrato per la creazione e l'utilizzo di modelli di data mining. È possibile eseguire facilmente l'associazione a origini dati, creare e testare più modelli sugli stessi dati e distribuire modelli da utilizzare nelle analisi predittive.
Nell'esercitazione di base sul data mining è stato descritto come utilizzare SQL Server Data Tools (SSDT) per creare una soluzione di data mining e sono stati compilati tre modelli a supporto di una campagna di mailing diretto per analizzare il comportamento di acquisto dei clienti e per individuare i potenziali acquirenti.
Questa esercitazione intermedia viene compilata su tale esperienza acquisita e introduce diversi nuovi scenari, inclusi i requisiti aziendali comuni come la previsione e il Market basket analysis. Durante l'esercitazione verrà illustrato come creare un modello Time Series, un modello di associazione e un modello Sequence Clustering. Infine, verrà illustrato come utilizzare la rete neurale per esplorare le correlazioni dei dati e per utilizzare la regressione logistica per le stime.
Le lezioni sono indipendenti e possono essere completate separatamente.
Per completare le esercitazioni seguenti, l'utente deve avere familiarità con gli strumenti di data mining e con i visualizzatori dei modelli di data mining descritti nell'esercitazione di base sul data mining.
In tutti gli scenari viene utilizzata l'origine dati AdventureWorksDW2012 , tuttavia verranno create viste origine dati diverse per i diversi scenari. È possibile completare le lezioni in qualsiasi ordine, purché si crei innanzitutto l'origine dati.
Scenari della lezione
Dopo la conclusione positiva della campagna di mailing diretto, si supponga di aver ricevuto la richiesta di sfruttare le proprie conoscenze di data mining per sviluppare diversi nuovi modelli da utilizzare nella pianificazione aziendale. Di seguito vengono descritte alcune di queste attività:
Previsione:: verrà creato un modello Time Series per prevedere le vendite di prodotti nelle diverse aree geografiche in tutto il mondo. Verranno sviluppati singoli modelli per ogni regione e verrà illustrato come utilizzare la stima incrociata.
Market basket analysis: verrà creato un modello di associazione per analizzare raggruppamenti di prodotti acquistati durante le visite al sito e-commerce di Adventure Works Cycles. Questo modello di analisi degli acquisti può essere utilizzato per consigliare prodotti ai clienti.
Analisi delle sequenze: viene compilato un modello Sequence Clustering per analizzare l'ordine in cui i clienti acquistano i prodotti. Sulla base di questo modello è possibile pianificare le modifiche alla progettazione del sito Web o le nuove offerte di prodotti.
Analisi dei fattori: viene utilizzato un modello di rete neurale per esplorare le possibili cause di una qualità del servizio insufficiente nei dati del call center. In base alle informazioni approfondite del modello preliminare, verrà creato un modello di regressione logistica per individuare le possibili strategie di miglioramento della qualità del servizio.
Lezioni dell'esercitazione
In questa esercitazione viene illustrato come creare e utilizzare tipi diversi di algoritmi di data mining. L'esercitazione è suddivisa nelle lezioni seguenti:
Lezione 1: Creazione della soluzione intermedia di data mining (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un nuovo progetto basato sul database AdventureWorksDW2012 , per supportare diverse nuove viste origine dati e molti più modelli di data mining.Lezione 2: Compilazione di uno scenario di previsione (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di previsione. Verranno inoltre esplorati i modelli di data mining compilati con l'algoritmo Microsoft Time Series.Verranno compilati modelli per le singole aree geografiche, oltre a un modello generale che può essere utilizzato per la stima incrociata.
Lezione 3: Compilazione di uno scenario Market Basket (Esercitazione intermedia sul data mining)
In questa lezione verrà aggiunta una nuova vista origine dati e verrà illustrato come utilizzare le chiavi e le tabelle nidificate. In base a questi dati, verrà creato un modello di data mining che può essere utilizzato in uno scenario di analisi degli acquisti. Verranno inoltre esplorati i modelli di data mining compilati con l'algoritmo Microsoft Association.Lezione 4: Compilazione di uno scenario di clustering delle sequenze (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di clustering delle sequenze. Verranno inoltre esaminati i modelli di data mining compilati con l'algoritmo Microsoft Sequence Clustering.Lezione 5: Compilazione dei modelli di rete neurale e di regressione logistica (Esercitazione intermedia sul data mining)
In questa lezione si creeranno alcuni modelli di data mining correlati, utilizzando Microsoft Neural Network e gli algoritmi di Microsoft Logistic Regression. Si apprenderà inoltre a utilizzare le viste origine dati per esplorare i dati sottostanti i modelli.
Requisiti
Verificare che sia installato quanto segue:
Microsoft SQL Server 2012
Microsoft SQL Server Analysis Services
SQL Server con il database AdventureWorksDW2012 .
Per una maggiore sicurezza, i database di esempio non vengono installati per impostazione predefinita. Per installare i database ufficiali di Microsoft SQL Server, visitare la pagina Web relativa ai database di esempio di Microsoft SQL e selezionare la versione appropriata del database di esempio.
Vedere anche
Attivitá
Esercitazione di base sul data mining