Algoritmi di data mining (Analysis Services - Data mining)
L'algoritmo di data mining è il meccanismo che consente di creare un modello di data mining. Per creare un modello, tramite un algoritmo viene innanzitutto analizzato un set di dati, per cercare tendenze e modelli specifici. I risultati dell'analisi vengono utilizzati dall'algoritmo per definire i parametri del modello di data mining. Questi parametri vengono quindi applicati all'intero set di dati per estrarre schemi utilizzabili e statistiche dettagliate.
Il modello di data mining creato da un algoritmo può avere forme diverse, tra cui:
Set di regole che descrive in che modo i prodotti vengono raggruppati in una transazione.
Albero delle decisioni che consente di stimare se un cliente specifico acquisterà un prodotto.
Modello matematico per la previsione delle vendite.
Set di cluster che descrive in che modo i case di un set di dati sono correlati.
MicrosoftSQL ServerAnalysis Services include diversi algoritmi che è possibile utilizzare nelle soluzioni di data mining. Questi algoritmi costituiscono un subset di tutti gli algoritmi che è possibile utilizzare per il data mining. È inoltre possibile utilizzare algoritmi di terze parti conformi con la specifica OLE DB per il data mining. Per ulteriori informazioni sugli algoritmi di terze parti, vedere Algoritmi plug-in.
Tipi di algoritmi di data mining
Analysis Services include i tipi di algoritmi seguenti:
Algoritmi di classificazione che consentono di stimare una o più variabili discrete, in base agli altri attributi del set di dati. Un esempio di algoritmo di classificazione è quello illustrato in Algoritmo Microsoft Decision Trees.
Algoritmi di regressione che consentono di stimare una o più variabili continue, ad esempio profitto o perdita, in base ad altri attributi nel set di dati. Un esempio di algoritmo di regressione è quello illustrato in Algoritmo Microsoft Time Series.
Algoritmi di segmentazione che consentono di dividere i dati in gruppi, o cluster, di elementi con proprietà simili. Un esempio di algoritmo di segmentazione è quello illustrato in Algoritmo Microsoft Clustering.
Algoritmi di associazione che consentono di trovare le correlazioni tra attributi diversi in un set di dati. L'applicazione più comune di questo tipo di algoritmo è costituita dall'utilizzo per la creazione di regole di associazione, che è possibile utilizzare in un'analisi di mercato sugli acquisti. Un esempio di algoritmo di associazione è quello illustrato in Algoritmo Microsoft Association Rules.
Algoritmi di analisi delle sequenze che consentono di riepilogare le sequenze o gli episodi frequenti nei dati, ad esempio un flusso di percorso Web. Un esempio di algoritmo di analisi delle sequenze è quello illustrato in Algoritmo Microsoft Sequence Clustering.
Applicazione degli algoritmi
La scelta dell'algoritmo più appropriato da utilizzare per un'attività aziendale specifica può rivelarsi complessa. Sebbene sia possibile utilizzare algoritmi diversi per eseguire la stessa attività aziendale, ogni algoritmo produce un risultato diverso e alcuni algoritmi possono produrre più di un tipo di risultato. È ad esempio possibile utilizzare l'algoritmo Microsoft Decision Trees non solo per le stime ma anche per ridurre il numero di colonne in un set di dati, in quanto l'albero decisionale può consentire di identificare colonne che non hanno effetto sul modello di data mining finale.
Non è inoltre necessario utilizzare gli algoritmi in modo indipendente. In una singola soluzione di data mining è possibile utilizzare alcuni algoritmi per esplorare i dati e altri per stimare un risultato specifico in base ai dati. È ad esempio possibile utilizzare un algoritmo di clustering, che consente di riconoscere gli schemi, per suddividere i dati in gruppi più o meno omogenei e quindi utilizzare i risultati per creare un modello di albero decisionale migliore. È possibile utilizzare più algoritmi in una soluzione per eseguire attività separate, ad esempio utilizzando un algoritmo di albero di regressione per ottenere informazioni sulle previsioni finanziarie e un algoritmo basato su una regola per eseguire un'analisi di mercato sugli acquisti.
I modelli di data mining consentono di stimare valori, produrre riepiloghi di dati e trovare correlazioni nascoste. Nella tabella seguente sono inclusi suggerimenti sugli algoritmi da utilizzare per attività specifiche, che offrono un aiuto per la selezione degli algoritmi per la soluzione di data mining.
Attività |
Algoritmo Microsoft da utilizzare |
---|---|
Stima di un attributo discreto. Stimare, ad esempio, se il destinatario di una campagna di mailing diretto acquisterà un prodotto. |
Algoritmo Microsoft Decision Trees Algoritmo Microsoft Naive Bayes |
Stima di un attributo continuo. Prevedere, ad esempio, le vendite dell'anno successivo. |
|
Stima di una sequenza. Eseguire, ad esempio, un'analisi clickstream del sito Web di una società. |
|
Ricerca di gruppi di elementi comuni nelle transazioni. Utilizzare, ad esempio, analisi di mercato sugli acquisti per suggerire a un cliente ulteriori prodotti da acquistare. |
|
Ricerca di gruppi di elementi simili. Segmentare, ad esempio, i dati demografici in gruppi, per comprendere meglio le relazioni tra gli attributi. |
Poiché ogni modello restituisce un tipo diverso di risultati, in Analysis Services è disponibile un visualizzatore separato per ogni algoritmo. Per la visualizzazione di un modello di data mining in Analysis Services viene utilizzato il visualizzatore appropriato nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. Per ulteriori informazioni, vedere Visualizzazione di un modello di data mining.
Informazioni sugli algoritmi
Nella tabella seguente vengono forniti collegamenti ai tipi di informazioni disponibili per ogni algoritmo:
Descrizione dell'algoritmo di base Viene fornita una spiegazione di base della funzione e dell'utilizzo dell'algoritmo, oltre a uno scenario aziendale in cui l'algoritmo potrebbe risultare utile.
Riferimento tecnico Sono elencati i parametri che è possibile impostare per controllare il comportamento dell'algoritmo e personalizzare i risultati nel modello. Vengono forniti dettagli tecnici aggiuntivi sull'implementazione dell'algoritmo, suggerimenti relativi alle prestazioni e requisiti dei dati.
Esecuzione di una query su un modello Vengono forniti esempi di query che è possibile utilizzare con ogni tipo di modello.È possibile eseguire una query su un modello per ottenere ulteriori informazioni sugli schemi nel modello o per fare delle stime sulla base di tali schemi.
Contenuto del modello di data miningViene descritto come le informazioni vengono archiviate in una struttura comune per tutti i tipi di modello e viene illustrato come interpretare tali informazioni. Dopo avere creato un modello, è possibile esplorarlo utilizzando i visualizzatori forniti in BI Development Studio oppure scrivere query per restituire informazioni direttamente dal contenuto del modello utilizzando il linguaggio DMX.