Esecuzione di query su un modello di regressione lineare (Analysis Services - Data mining)
Quando si crea una query su un modello di data mining è possibile creare una query sul contenuto che fornisce dettagli sui pattern individuati durante l'analisi oppure una query di stima che utilizza i pattern presenti nel modello di data mining per eseguire stime relative a nuovi dati. Una query sul contenuto potrebbe ad esempio fornire dettagli aggiuntivi sulla formula di regressione, mentre una query di stima potrebbe indicare se un nuovo punto dati si adatta al modello. Utilizzando una query è inoltre possibile recuperare metadati relativi al modello.
In questa sezione viene illustrato come creare query per i modelli basati sull'algoritmo Microsoft Linear Regression. Per ulteriori informazioni sulla struttura di un modello di regressione lineare, vedere Contenuto dei modelli di data mining per i modelli di regressione lineare (Analysis Services - Data mining).
[!NOTA]
Poiché la regressione lineare è basata su un case specifico dell'algoritmo Microsoft Decision Trees, alcuni modelli di albero delle decisioni che utilizzano attributi stimabili continui possono contenere formule di regressione. Per ulteriori informazioni, vedere Riferimento tecnico per l'algoritmo Microsoft Decision Trees.
Query sul contenuto
Restituzione dei parametri del modello mediante il set di righe dello schema di data mining
Restituzione della formula di regressione per il modello mediante DMX
Restituzione del coefficiente per il modello
Query di stima
Esecuzione di stime mediante una query singleton
Restituzione di statistiche descrittive da un modello di regressione
Torna all'inizio
Per riprodurre i risultati per le query di esempio, è possibile creare un modello di regressione lineare come descritto nell'argomento seguente. Sebbene sia molto semplice, il modello dimostra i concetti di base per utilizzare Progettazione modelli di data mining per personalizzare un modello di regressione lineare.
Procedura: Applicazione dell'uso di regressori in un modello
Ricerca di informazioni sul modello di regressione lineare
La struttura di un modello di regressione lineare è estremamente semplice poiché il modello di data mining rappresenta i dati come nodo singolo che a sua volta definisce la formula di regressione.
In questa sezione sono contenuti esempi sul modo di ottenere ulteriori informazioni sul modello stesso, incluse la formula di regressione e le statistiche descrittive relative ai dati.
Query di esempio 1: Restituzione dei parametri del modello mediante il set di righe dello schema di data mining
Eseguendo una query sul set di righe dello schema di data mining, è possibile trovare i metadati relativi al modello. Tali dati potrebbero includere la data di creazione, la data dell'ultima elaborazione del modello, il nome della struttura di data mining sulla quale si basa il modello e il nome della colonna designata come attributo stimabile. È inoltre possibile restituire i parametri utilizzati durante la creazione del modello.
SELECT MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Regression'
Risultati dell'esempio:
MINING_PARAMETERS |
---|
MINING_PARAMETERS MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, FORCE_REGRESSOR=[Average Time Per Issue],[Total Operators] |
[!NOTA]
Se non è stato specificato alcun regressore, al parametro FORCE_REGRESSOR è associato il valore "FORCE_REGRESSOR = ".
Torna all'inizio
Query di esempio 2: Restituzione della formula di regressione per il modello mediante DMX
La query seguente restituisce il contenuto del modello di data mining per il modello di regressione lineare, ovvero il contenuto del nodo che contiene la formula di regressione. È inoltre possibile utilizzare questa query in un modello di albero delle decisioni se uno dei nodi contiene una formula di regressione.
Ogni variabile e ogni coefficiente vengono archiviati in una riga separata della tabella NODE_DISTRIBUTION nidificata. Se si desidera visualizzare la formula di regressione completa, utilizzare il Visualizzatore Microsoft Decision Trees, fare clic sul nodo (Tutti) e aprire Legenda data mining.
SELECT FLATTENED NODE_DISTRIBUTION as t
FROM [Call Center Regression].CONTENT
[!NOTA]
Se si fa riferimento a colonne singole della tabella nidificata utilizzando una query quale SELECT <column name> from NODE_DISTRIBUTION, alcune colonne, ad esempio SUPPORT o PROBABILITY, devono essere racchiuse tra parentesi per distinguerle dalle parole chiave riservate con lo stesso nome.
Risultati previsti:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.SUPPORT |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
---|---|---|---|---|---|
Service Grade |
Missing |
0 |
0 |
0 |
1 |
Service Grade |
0.09875 |
120 |
1 |
0.00157927083333334 |
3 |
Average Time Per Issue |
0.00136989326310586 |
0 |
0 |
187.866597222222 |
7 |
Average Time Per Issue |
12.0822151449249 |
0 |
0 |
0 |
8 |
Average Time Per Issue |
79.8416666666667 |
0 |
0 |
187.866597222222 |
9 |
Total Operators |
-0.000426156789860463 |
0 |
0 |
24.0799305555556 |
7 |
Total Operators |
-3.19762422385219 |
0 |
0 |
0 |
8 |
Total Operators |
10.6916666666667 |
0 |
0 |
24.0799305555556 |
9 |
-0.00606823493688524 |
0 |
0 |
0.00121526993847281 |
11 |
In Legenda data mining, invece, la formula di regressione appare come segue:
Service Grade = 0.070+0.001*(Average Time Per Issue-79.842)-0.0004*(Total Operators-10.692)
Alcuni valori di Legenda data mining potrebbero essere arrotondati. In Legenda data mining sono tuttavia contenuti sostanzialmente gli stessi valori della tabella NODE_DISTRIBUTION.
I valori della colonna VALUETYPE indicano il tipo di informazioni contenuto in ogni riga. Questa indicazione risulta utile se i risultati vengono elaborati a livello di programmazione. Nella tabella seguente sono mostrati i tipi di valore che vengono restituiti per una formula di regressione lineare.
VALUETYPE |
---|
1 (Mancante) |
3 (Continuo) |
7 (Coefficiente) |
8 (Miglioramento punteggio) |
9 (Statistiche) |
7 (Coefficiente) |
8 (Miglioramento punteggio) |
9 (Statistiche) |
11 (Intercetta) |
Per ulteriori informazioni sul significato di ogni tipo di valore per i modelli di regressione, vedere Contenuto dei modelli di data mining per i modelli di regressione lineare (Analysis Services - Data mining).
Torna all'inizio
Query di esempio 3: Restituzione del coefficiente per il modello
Utilizzando l'enumerazione VALUETYPE, è possibile restituire solo il coefficiente per l'equazione di regressione, come mostrato nella query seguente:
SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION
WHERE VALUETYPE = 11)
AS t
FROM [Call Center Regression].CONTENT
Questa query restituisce due righe, una dal contenuto del modello di data mining e la riga dalla tabella nidificata che contiene il coefficiente. La colonna ATTRIBUTE_NAME non è inclusa, in quanto è sempre vuota per il coefficiente.
MODEL_NAME |
t.ATTRIBUTE_VALUE |
t.VALUETYPE |
---|---|---|
Call Center Regressors2 |
-0.00606823493688524 |
11 |
Esecuzione di stime tramite il modello
È possibile creare query di stima sui modelli di regressione lineare utilizzando la scheda Stima modello di data mining in Progettazione modelli di data mining. Il generatore della query di stima è disponibile sia in SQL Server Management Studio che in Business Intelligence Development Studio.
[!NOTA]
È inoltre possibile creare query nei modelli di regressione utilizzando i componenti aggiuntivi Data mining di SQL Server 2005 per Excel oppure i componenti aggiuntivi Data mining di SQL Server 2008 per Excel. Anche se i componenti aggiuntivi Data mining per Excel non creano modelli di regressione, è possibile esplorare ed eseguire una query su qualsiasi modello di data mining archiviato in un'istanza di Analysis Services.
Torna all'inizio
Query di esempio 4: Esecuzione di stime mediante una query singleton
Il modo più semplice per creare una query singleton in un modello di regressione consiste nell'utilizzare la finestra di dialogo Input query singleton. Per creare la query DMX seguente, è possibile selezionare il modello di regressione adatto, scegliere Query singleton, quindi digitare 10 come valore per Total Operators.
SELECT
Predict([Call Center Regression].[Service Grade])
FROM
[Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t
Risultati dell'esempio:
Yearly Income |
---|
0.0992841946529471 |
Torna all'inizio
Query di esempio 5: Restituzione di statistiche descrittive da un modello di regressione
È possibile utilizzare molte delle funzioni di stima standard con i modelli di regressione lineare. Nell'esempio seguente viene illustrato come aggiungere alcune statistiche descrittive ai risultati della query di stima.
SELECT
Predict([Call Center Regression].[Service Grade]) as [Predicted Service],
PredictStdev([Call Center Regression].[Service Grade]) as [Standard Deviation]
FROM
[Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t
Risultati dell'esempio:
Predicted Service |
Standard Deviation |
---|---|
0.0990447584463201 |
0.0348607220015996 |
Torna all'inizio
Elenco delle funzioni di stima
Tutti gli algoritmi Microsoft supportano un set comune di funzioni. L'algoritmo Microsoft Linear Regression supporta inoltre funzioni aggiuntive, elencate nella tabella seguente.
|
Per un elenco delle funzioni comuni a tutti gli algoritmi Microsoft, vedere Algoritmi di data mining (Analysis Services - Data mining). Per ulteriori informazioni sull'utilizzo di queste funzioni, vedere Guida di riferimento alle funzioni DMX (Data Mining Extensions).
Cronologia modifiche
Aggiornamento del contenuto |
---|
Aggiunta di collegamenti negli argomenti per semplificare la revisione degli esempi di query. |
Modifica dell'esempio per utilizzare un modello con una corrispondenza migliore. Aggiunta di un collegamento a un nuovo argomento che descrive la creazione del modello di regressione lineare di esempio. |
Vedere anche