Novità (Analysis Services - Data mining)
Quest'ultima versione di MicrosoftSQL ServerAnalysis Services introduce nuove funzionalità e miglioramenti.
Creazione di set di test dei dati di controllo
Quando si crea una struttura di data mining, è ora possibile dividere i dati in essa contenuti in un set di training e in un set di testing. La definizione della partizione viene archiviata con la struttura. È quindi possibile riutilizzare i set di training e di testing con qualsiasi modello di data mining basato su tale struttura.
Sebbene i dati vengano divisi in modo casuale tra partizioni di training e di testing, è anche possibile specificare il valore di inizializzazione utilizzato per creare le partizioni, qualora sia necessario ricreare una partizione.
È possibile specificare la dimensione del set di testing come percentuale del numero totale di righe, come numero massimo di righe o come una combinazione di questi requisiti. Per ulteriori informazioni sull'utilizzo dei set di dati di training e di testing, vedere Partizionamento dei dati in set di training e in set di testing (Analysis Services - Data mining).
Per ulteriori informazioni su tutte le funzionalità di convalida dei modelli disponibili in SQL Server 2008, vedere Convalida di modelli di data mining (Analysis Services - Data mining).
Applicazione di filtri a case del modello
È ora possibile associare filtri a un modello di data mining e applicarli durante il training e il testing L'applicazione di un filtro al modello consente di controllare i dati utilizzati per il training del modello e rende più semplice la valutazione delle prestazioni del modello in subset dei dati.
È possibile ad esempio che si desideri conoscere l'accuratezza di un modello di mailing diretto esclusivamente per i clienti con un reddito superiore a un determinato livello. È possibile applicare il filtro nella colonna relativa al reddito del modello di data mining quando si crea il grafico di accuratezza, quindi visualizzare i risultati solo per i dati demografici desiderati.
In Business Intelligence Development Studio sono inoltre disponibili nuovi editor di filtri che consentono di creare condizioni complesse applicabili sia a tabelle del case che a tabelle nidificate.
Per ulteriori informazioni sulla creazione di filtri per i modelli di data mining, vedere Creazione di filtri per i modelli di data mining (Analysis Services - Data mining).
Per ulteriori informazioni sul filtraggio dei dati per il testing dei modelli di data mining, vedere Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining).
Convalida incrociata di più modelli di data mining
La convalida incrociata è un metodo consolidato per la valutazione dell'accuratezza dei modelli di data mining. Prevede l'esecuzione in modo interattivo delle seguenti operazioni: partizionamento dei dati della struttura di data mining in subset, creazione di modelli nei subset e valutazione dell'accuratezza del modello per ogni partizione. La verifica delle statistiche restituite consente di determinare l'affidabilità del modello di data mining e di effettuare con maggiore semplicità il confronto tra i modelli basati sulla stessa struttura.
La convalida incrociata è disponibile nella vista Grafico accuratezza modello di data mining in Progettazione modelli di data mining. È inoltre possibile partizionare una struttura di data mining, eseguire il test di più modelli di data mining e generare un'analisi utilizzando le stored procedure di Analysis Services.
Per generare un report di convalida incrociata in SQL Server 2008, specificare la struttura di data mining e l'attributo stimabile, quindi il numero di riduzioni in cui segmentare i dati del case.
Analysis Services restituisce una tabella in cui sono segnalate le statistiche, quali la probabilità o la radice dell'errore quadratico medio delle singole partizioni e la deviazione media e standard di tutte le misure per i modelli di aggregazione. Per ulteriori informazioni, vedere Convalida incrociata (Analysis Services - Data mining).
Supporto per i componenti aggiuntivi Data mining per Office 2007
SQL Server 2008 supporta la creazione, la gestione e l'utilizzo di modelli di data mining di Microsoft Excel quando si utilizzano i componenti aggiuntivi Data mining di Microsoft SQL Server 2008 per Office 2007. La versione più recente di questo diffuso componente aggiuntivo gratuito è stata migliorata con l'aggiunta del supporto per le partizioni di training e di test sul lato server, la convalida incrociata e diversi nuovi strumenti di analisi, ad esempio Market Basket Analysis e uno strumento stampabile di calcolo stime.
È inoltre possibile utilizzare la procedura guidata Modello di documento per semplificare la creazione della documentazione per le strutture e i modelli archiviati in un'istanza di SQL Server 2008. Per ulteriori informazioni sui componenti aggiuntivi, vedere Componenti aggiuntivi Data mining per Office 2007..
Miglioramenti all'algoritmo Microsoft Time Series
Per migliorare l'accuratezza e la stabilità di alcune stime nei modelli Time Series, è stato aggiunto un nuovo algoritmo all'algoritmo Microsoft Time Series. Il nuovo algoritmo, basato sul noto algoritmo ARIMA, consente di ottenere stime a lungo termine migliori rispetto all'algoritmo ARTXP utilizzato in Analysis Services. ARTXP è un algoritmo dell'albero autoregressivo ottimizzato per l'esecuzione di stime basate su un singolo intervallo di tempo o a breve termine.
Per impostazione predefinita, la nuova implementazione dell'algoritmo Microsoft Time Series utilizza l'algoritmo ARTXP per il training di una versione del modello e l'algoritmo ARIMA per il training di un'altra versione. L'algoritmo pondera quindi i risultati dei due modelli per restituire le caratteristiche di stima preferite. Se non si desidera utilizzare l'implementazione predefinita, è possibile fare in modo che l'algoritmo Microsoft Time Series utilizzi solo l'algoritmo ARTXP o ARIMA. In SQL Server 2008 Enterprise Edition è possibile specificare una ponderazione personalizzata degli algoritmi al fine di ottenere la stima migliore a fronte di un periodo di tempo variabile.
Poiché l'algoritmo Microsoft Time Series accetta i dati anche durante la stima, sono ora consentiti nuovi scenari aziendali. È possibile ad esempio creare un modello di stima dei ricavi basato sulle medie tra prodotti, sulle aggregazioni per area o su altri set di dati estesi. È quindi possibile applicare tale modello alla serie temporale che mostra le vendite di un singolo prodotto. Applicando il modello generale, è possibile sfruttare la stabilità e la disponibilità dei dati di aggregazione e personalizzare la stima per il singolo prodotto.
È inoltre possibile eseguire il training dei modelli utilizzando più serie, quindi applicare i modelli a nuovi dati per la stima di scenari di simulazione.
Per ulteriori informazioni sui modelli di data mining Time Series, vedere Algoritmo Microsoft Time Series e PredictTimeSeries (DMX).
Drill-through ai case della struttura e alle colonne della struttura
Se si attiva il drill-through a una struttura di data mining, in SQL Server 2008 è possibile eseguire query sulla struttura di data mining e ottenere informazioni dettagliate sui case utilizzati per il training e il testing. È possibile creare query drill-through in una struttura utilizzando DMX (Data Mining Extensions).
Se il drill-through è attivato in un modello di data mining e nella struttura di data mining correlata, è inoltre possibile creare query per il recupero di colonne di dati dalla struttura di data mining sottostante. Ciò risulta utile se si desidera individuare informazioni dettagliate sui case in un nodo specifico. È possibile ad esempio recuperare informazioni di contatto per i clienti in un determinato cluster.
Per ulteriori informazioni, vedere Utilizzo del drill-through sui modelli di data mining e strutture di data mining (Analysis Services - Data mining).
Per esempi di query DMX in una struttura di data mining, vedere SELECT FROM <structure>.CASES.
Per esempi di drill-through da un modello ai dati della struttura, vedere SELECT FROM <model>.CASES (DMX).
Aggiunta di alias a colonne del modello di data mining
È ora possibile aggiungere alias alle colonne in un modello di data mining, in modo da poter individuare il contenuto delle colonne e fare riferimento alla colonna nelle istruzioni DMX con maggiore semplicità.
Se ad esempio si crea una struttura di data mining che contiene versioni continue e discretizzate degli stessi dati, è possibile assegnare a entrambe le colonne lo stesso nome per semplificarne il confronto.
Per ulteriori informazioni sulla gestione e sulla visualizzazione degli alias, vedere Impostazione delle proprietà in un modello di data mining o Procedura: Creazione di un alias per una colonna di un modello.
Per informazioni sulla creazione di un alias di colonna mediante DMX, vedere ALTER MINING STRUCTURE (DMX).
Esecuzione di una query sui set di righe dello schema di data mining
In SQL Server 2008 molti dei set di righe esistenti dello schema di data mining OLE DB sono stati esposti come set di tabelle di sistema su cui è facile eseguire query tramite istruzioni DMX. In questo modo risulta semplice recuperare metadati relativi a modelli e strutture, estrarre dettagli dal contenuto del modello di data mining o monitorare un'istanza o un servizio di Analysis Services.
Per ulteriori informazioni, vedere Esecuzione di query sui set di righe dello schema di data mining (Analysis Services - Data mining).
Percorso dei nuovi esempi
La documentazione in linea non include più database e applicazioni di esempio di SQL Server. I database e le applicazioni di esempio sono ora disponibili sul sito Web SQL Server Samples. Questo sito Web non solo rende più semplice per gli utenti l'individuazione degli esempi, ma rende disponibili ulteriori nuovi esempi relativi a MicrosoftSQL Server e Business intelligence. Nel sito Web SQL Server Samples è possibile effettuare quanto segue:
Esplorare gli esempi a cui hanno collaborato sviluppatori, utenti e la community Microsoft Most Valuable Professional (MVP).
Scaricare database di esempio e progetti di codice.
Visualizzare o partecipare a un'area di discussione in cui è possibile riportare problemi e porre domande sugli esempi per ogni area tecnologica.
Installazione affiancata con SQL Server 2005 Analysis Services
È ora possibile effettuare l'installazione affiancata di SQL Server 2008Analysis Services e SQL Server 2005 Analysis Services (SSAS). Per ulteriori informazioni, vedere Utilizzo di più versioni e istanze di SQL Server.
Per importanti informazioni sui problemi di installazione affiancata riguardanti Analysis Services, vedere il file Leggimi fornito con questa versione.
Backup e ripristino di database di Analysis Services
Sono stati apportati miglioramenti alla funzionalità di backup e ripristino di un database di Analysis Services. È previsto un numero inferiore di restrizioni sulle dimensioni del database; sono stati inoltre ridotti notevolmente i tempi necessari per l'esecuzione delle operazioni di backup e ripristino.
Per ulteriori informazioni, vedere Novità (Analysis Services - Database multidimensionale).
Altri miglioramenti di Analysis Services
Se si utilizza Analysis Services per creare cubi OLAP utilizzati anche per il data mining, la progettazione delle dimensioni e delle gerarchie e degli attributi correlati potrebbe risultare più semplice. Progettazione dimensioni include una nuova finestra di progettazione Relazione tra attributi che consente di progettare le relazioni tra attributi, garantendone la conformità con le procedure consigliate.
Per ulteriori informazioni, vedere Novità (Analysis Services - Database multidimensionale).
Vedere anche