Creazione di una nuova struttura di data mining

Quando si genera una soluzione di modelli di data mining in MicrosoftSQL ServerAnalysis Services, il primo passaggio consiste nella creazione di una struttura di data mining tramite Creazione guidata modello di data mining (Analysis Services - Data mining) in Business Intelligence Development Studio. La struttura di data mining definisce il dominio da cui vengono generati i modelli di data mining. Tutti i modelli di data mining si basano su una struttura.

Le strutture di data mining utilizzano origini dati relazionali o di elaborazione analitica in linea (OLAP). Le strutture di data mining relazionali si basano sui dati archiviati in sistemi del database relazionale, definiti come vista origine dati. Le strutture di data mining OLAP si basano su una dimensione e sulle misure correlate di un cubo OLAP che esiste nello stesso database della struttura di data mining.

Per ulteriori informazioni, vedereProgettazione di database e Progettazione di oggetti di database multidimensionali di Analysis Services

La Creazione guidata modello di data mining definisce una struttura di data mining e consente di aggiungere un modello iniziale di data mining. Poiché una struttura di data mining può contenere più modelli di data mining, Progettazione modelli di data mining consente di aggiungere ulteriori modelli.

Nelle sezioni seguenti vengono fornite ulteriori informazioni sulla creazione di nuove strutture di data mining con la Creazione guidata modello di data mining e sulla configurazione delle opzioni nella struttura di data mining che consentono di creare un set di test o di eseguire query sui dati nella struttura di data mining.

  • Creazione di una struttura di data mining relazionale

  • Creazione di una struttura di data mining OLAP

  • Attivazione del controllo e del drill-through

Creazione di una struttura di data mining relazionale

Le strutture di data mining relazionali possono essere basate sui dati disponibili tramite un'origine dei dati OLE DB. Se l'origine dei dati è contenuta in più tabelle, è possibile utilizzarla nella procedura guidata come una singola tabella del case tramite tabelle nidificate.

Per ulteriori informazioni:Tabelle nidificate (Analysis Services - Data mining)

La Creazione guidata modello di data mining consente di eseguire in modo semplificato i passaggi necessari per la creazione della struttura di un nuovo modello di data mining:

  1. Selezione di un tipo di origine dei dati, in questo caso un database relazionale

  2. Scelta di creare solo una struttura o una struttura con un modello di data mining.

  3. Selezione di un algoritmo per il modello.

  4. Selezione di un'origine dei dati

  5. Selezione di una tabella del case e, facoltativamente, di tabelle nidificate

  6. Selezione del tipo di colonna (stimabile, di input o chiave).

  7. Impostazione dei tipi di contenuto delle colonne

  8. Specifica di un set di dati di controllo facoltativo.

  9. Attivazione del drill-through sulla struttura. Denominazione e salvataggio della nuova struttura di data mining e del modello di data mining associato.

Per ulteriori informazioni:Algoritmi di data mining (Analysis Services - Data mining), Colonne del modello di data mining, Colonne della struttura di data mining, Tipi di dati (data mining), Tipi di contenuto (Data mining)

Creazione di una struttura di data mining OLAP

I cubi OLAP contengono spesso un numero talmente elevato di membri e dimensioni da rendere difficile la comprensione del punto di inizio del data mining. Per identificare gli schemi inclusi nei cubi, in genere è necessario identificare una sola dimensione desiderata, quindi iniziare a esplorare gli schemi correlati alla dimensione. Nella tabella seguente sono elencate diverse attività comuni di data mining OLAP e vengono descritti gli scenari di esempio in cui è possibile applicare ogni attività identificando l'algoritmo di data mining corrispondente da utilizzare.

Attività

Scenario di esempio

Algoritmo

Raggruppamento di membri in cluster

Segmentare una dimensione relativa ai clienti in base alle proprietà del membro corrispondente, ai prodotti acquistati dai clienti e alla quantità di denaro spesa dai clienti.

Algoritmo Microsoft Clustering

Ricerca di membri interessanti o anomali

Identificare membri interessanti o anomali in una dimensione relativa ai negozi in base a vendite, profitti, ubicazione e dimensioni del punto vendita.

Algoritmo Microsoft Decision Trees

Ricerca di celle interessanti o anomale

Identificare le vendite dei negozi che risultano controcorrente rispetto alle tendenze tipiche registrate nel tempo.

Algoritmo Microsoft Time Series

La Creazione guidata modello di data mining consente di eseguire in modo semplificato i passaggi necessari per la creazione della struttura di un nuovo modello di data mining:

  1. Selezione di un tipo di origine dei dati, in questo caso un cubo

  2. Selezione di un algoritmo

  3. Selezione di una dimensione del cubo di origine

  4. Selezione di una chiave del case

  5. Selezione delle colonne del case

  6. Selezione di eventuali tabelle nidificate

  7. Selezione dell'utilizzo della colonna (stimabile, di input o chiave).

  8. Impostazione dei tipi di contenuto delle colonne

  9. Sezionamento del cubo di origine

  10. Creazione di un set di dati di testing facoltativo.

  11. Denominazione e salvataggio della nuova struttura di data mining e del modello associato

Nell'ultima pagina della procedura guidata è possibile impostare le opzioni seguenti:

  • Consenti drill-through

  • Crea dimensione del modello di data mining

  • Crea il cubo utilizzando la dimensione del modello di data mining

Se si sceglie di creare una nuova dimensione del modello di data mining nel cubo di origine, è possibile includere le informazioni individuate dall'algoritmo di data mining nell'origine dei dati OLAP. Creando una dimensione del modello di data mining, è possibile esplorare ed eseguire una query sul contenuto del modello, sotto forma di dimensione. Questa opzione è disponibile per i modelli creati utilizzando gli algoritmi di Microsoft Clustering, Microsoft Decision Trees e Microsoft Association Rules.

Se si seleziona l'opzione per la creazione di un nuovo cubo, quest'ultimo viene definito nel database che include la dimensione del modello di data mining e, facoltativamente, tutte le dimensioni correlate.

Per ulteriori informazioni:Algoritmi di data mining (Analysis Services - Data mining), Colonne del modello di data mining, Colonne della struttura di data mining, Tipi di dati (data mining), Tipi di contenuto (Data mining)

Attivazione del drill-through e del controllo

Quando si crea la struttura di data mining, è anche necessario impostare due importanti opzioni per l'utilizzo dei dati: controllo e drill-through. Il controllo è una funzionalità di SQL Server 2008 che consente di partizionare i dati nella struttura di data mining in un set di training e un set di testing, affinché vengano utilizzati con tutti i modelli associati alla struttura. Per ulteriori informazioni, vedere Partizionamento dei dati in set di training e in set di testing (Analysis Services - Data mining).

Il drill-through consente di visualizzare i dati di origine nella struttura di data mining eseguendo una query sul modello di data mining e risulta utile quando vengono visualizzati i risultati di un modello di data mining e si desidera visualizzare ulteriori dettagli dai case sottostanti. Ad esempio, è possibile trovare le informazioni di contatto, i case utilizzati per eseguire il raining di un determinato cluster e così via. Per utilizzare il drill-through, è necessario attivarlo durante la creazione della struttura di data mining. Non è possibile attivarlo in un secondo momento. Per ulteriori informazioni, vedere Utilizzo del drill-through sui modelli di data mining e strutture di data mining (Analysis Services - Data mining).