SystemGetAccuracyResults (Analysis Services - Data mining)

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

Restituisce la metrica di accuratezza per la convalida incrociata di una struttura di data mining e di tutti i modelli correlati, tranne i modelli di clustering.

Questa stored procedure restituisce la metrica per l'intero set di dati come un'unica partizione. Per partizionare il set di dati in sezioni incrociate e restituire metriche per ogni partizione, usare SystemGetCrossValidationResults (Analysis Services - Data Mining).

Nota

Questa stored procedure non è supportata per i modelli compilati usando l'algoritmo Microsoft Time Series o l'algoritmo Microsoft Sequence Clustering. Inoltre, per i modelli di clustering, usare la stored procedure separata SystemGetClusterAccuracyResults (Analysis Services - Data Mining).

Sintassi

  
SystemGetAccuracyResults(<mining structure>,   
[,<mining model list>]  
,<data set>  
,<target attribute>  
[,<target state>]  
[,<target threshold>]  
[,<test list>])  

Argomenti

struttura di data mining
Nome di una struttura di data mining nel database corrente.

(Obbligatorio)

model list
Elenco delimitato da virgole dei modelli da convalidare.

Il valore predefinito è Null. In questo modo vengono utilizzati tutti i modelli applicabili. Se si utilizza l'impostazione predefinita, i modelli di clustering vengono esclusi automaticamente dall'elenco di candidati per l'elaborazione.

Facoltativa

set di dati
Valore integer che indica quale partizione nella struttura di data mining viene utilizzato per il test. Il valore è derivato da una maschera di bit che rappresenta la somma dei valori seguenti, dove qualsiasi singolo valore è facoltativo:

Category Valore
Case di training 0x0001
Test case 0x0002
Filtro modello 0x0004

Per un elenco completo dei valori possibili, vedere la sezione Osservazioni di questo argomento.

(obbligatorio)

attributo di destinazione
Stringa che contiene il nome di un oggetto stimabile. Un oggetto stimabile può essere una colonna, una colonna della tabella nidificata o una colonna chiave della tabella nidificata di un modello di data mining.

(obbligatorio)

target state
Stringa che contiene un valore specifico da stimare.

Se si specifica un valore, viene raccolta la metrica per tale stato specifico.

Se non si specifica alcun valore oppure si specifica un valore null, viene calcolata la metrica per lo stato più probabile per ogni stima.

Il valore predefinito è Null.

(facoltativo).

target threshold
Numero compreso tra 0.0 e 1 che specifica la probabilità minima entro cui il valore della stima viene conteggiato come corretto.

Il valore predefinito è null, ovvero tutte le stime vengono conteggiate come corrette.

(facoltativo).

test list
Stringa che specifica le opzioni di testing. Questo parametro è riservato per usi futuri.

(facoltativo).

Tipo restituito

Il set di righe restituito contiene punteggi per ogni partizione e aggregazioni per tutti i modelli.

Nella tabella seguente vengono elencate le colonne restituite da GetValidationResults.

Nome colonna Descrizione
Modello Nome del modello sottoposto a test. All indica che il risultato è un'aggregazione per tutti i modelli.
AttributeName Nome della colonna stimabile.
AttributeState Valore di destinazione nella colonna stimabile.

Se questa colonna contiene un valore, la metrica viene raccolta solo per lo stato specifico.

Se questo valore non è specificato oppure è null, viene calcolata la metrica per lo stato più probabile per ogni stima.
PartitionIndex Indica la partizione a cui si applica il risultato.

Per questa procedura, è sempre 0.
PartitionCases Intero che indica il numero di righe nel set di case, in base al parametro del< set> di dati.
Test Tipo di test eseguito.
Misura Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo di modello e dal tipo del valore stimabile.

Per un elenco delle misure restituite per ogni tipo stimabile, vedere Misure nel report di convalida incrociata.

Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data Mining).
Valore Valore per la misura specificata.

Commenti

Nella tabella seguente vengono forniti esempi dei valori che è possibile utilizzare per specificare i dati nella struttura di data mining utilizzata per la convalida incrociata. Se si desidera utilizzare test case per la convalida incrociata, è necessario che la struttura di data mining contenga già un set di dati di testing. Per informazioni sulla definizione di un set di dati di testing quando si crea una struttura di data mining, vedere Set di dati di training e di testing.

Valore integer Descrizione
1 Vengono utilizzati solo i case di training.
2 Vengono utilizzati solo i test case.
3 Vengono utilizzati sia i case di training sia i test case.
4 Combinazione non valida.
5 Vengono utilizzati i case di training e viene applicato il filtro del modello.
6 Vengono utilizzati solo i test case e viene applicato il filtro del modello.
7 Vengono utilizzati sia i case di training sia i test case e viene applicato il filtro del modello.

Per altre informazioni sugli scenari in cui si userebbe la convalida incrociata, vedere Testing and Validation (Data Mining) .For more information about the scenarios in which you would use cross-validation, see Testing and Validation (Data Mining).

Esempio

Questo esempio restituisce le misure di accuratezza per un singolo modello di albero delle decisioni, ovvero v Target Mail DT, associato alla struttura di data mining vTargetMail . Il codice nella quarta riga indica che i risultati devono essere basati sui test case, filtrati per ogni modello per il filtro specifico di tale modello. [Bike Buyer] specifica che la colonna deve essere stimata e il numero 1 nella riga successiva indica che il modello deve essere valutato solo per il valore 1 specifico, indicando che l'acquisto verrà effettuato.

L'ultima riga del codice specifica che il valore soglia di stato corrisponde a 0.5. Ciò significa che le stime con una probabilità maggiore del 50 percento devono essere conteggiate come stime affidabili durante il calcolo dell'accuratezza.

CALL SystemGetAccuracyResults (  
[vTargetMail],  
[vTargetMail DT],  
6,  
'Bike Buyer',  
1,  
0.5  
)  

Risultati dell'esempio:

ModelName AttributeName AttributeState PartitionIndex PartitionSize Test Misura Valore
v Target Mail DT Bike Buyer 1 0 1638 Classificazione Veri positivi 605
v Target Mail DT Bike Buyer 1 0 1638 Classificazione Falsi positivi 177
v Target Mail DT Bike Buyer 1 0 1638 Classificazione Veri negativi 501
v Target Mail DT Bike Buyer 1 0 1638 Classificazione Falsi negativi 355
v Target Mail DT Bike Buyer 1 0 1638 Probabilità Punteggio in forma logaritmica -0.598454638753028
v Target Mail DT Bike Buyer 1 0 1638 Probabilità Accuratezza 0.0936717116894395
v Target Mail DT Bike Buyer 1 0 1638 Probabilità Radice errore quadratico medio 0.361630800104946

Requisiti

La convalida incrociata è disponibile solo in SQL Server Enterprise a partire da SQL Server 2008.

Vedere anche

SystemGetCrossValidationResults (Analysis Services - Data mining)
SystemGetAccuracyResults
SystemGetClusterCrossValidationResults (Analysis Services - Data mining)
SystemGetClusterAccuracyResults (Analysis Services - Data mining)