SystemGetClusterCrossValidationResults (Analysis Services - Data mining)
Partiziona la struttura di data mining nel numero di sezioni incrociate specificato, esegue il training di un modello per ogni partizione, quindi restituisce la metrica di accuratezza per ogni partizione.
Nota Questa stored procedure può essere utilizzata solo con una struttura di data mining che contiene almeno un modello di clustering. Per eseguire la convalida incrociata di modelli non di clustering, è necessario utilizzare SystemGetCrossValidationResults (Analysis Services - Data mining).
Sintassi
SystemGetClusterCrossValidationResults(
<structure name>,
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])
Argomenti
mining structure
Nome di una struttura di data mining nel database corrente.(obbligatorio)
mining model list
Elenco delimitato da virgole dei modelli di data mining da convalidare.Se non si specifica un elenco di modelli di data mining, la convalida incrociata viene eseguita su tutti i modelli di clustering associati alla struttura specificata.
Nota
Per eseguire la convalida incrociata di modelli non di clustering, è necessario utilizzare una stored procedure specifica, ovvero SystemGetCrossValidationResults (Analysis Services - Data mining).
(facoltativo)
fold count
Valore integer che specifica il numero di partizioni in cui separare il set di dati. Il valore minimo è 2. Il numero massimo di riduzioni è maximum integer o il numero di case, a seconda del valore inferiore.Ogni partizione conterrà all'incirca questo numero di case: max cases/fold count.
Nessun valore predefinito.
Nota
Il numero di riduzioni influisce in modo significativo sul tempo richiesto per l'esecuzione della convalida incrociata. Se si seleziona un numero troppo elevato, l'esecuzione della query potrebbe richiedere molto tempo e in alcuni casi potrebbe verificarsi il blocco o il timeout del server.
(obbligatorio)
max cases
Valore integer che specifica il numero massimo di case che è possibile sottoporre a test.Il valore 0 indica che verranno utilizzati tutti i case nell'origine dati.
Se si specifica un numero maggiore del numero effettivo di case presenti nel set di dati, verranno utilizzati tutti i case nell'origine dati.
(obbligatorio)
test list
Stringa che specifica le opzioni di testing.Nota Questo parametro è riservato per utilizzi futuri.
(facoltativo)
Tipo restituito
La tabella dei tipi restituiti contiene i punteggi per ogni singola partizione e le aggregazioni per tutti i modelli.
Nella tabella seguente vengono descritte le colonne restituite.
Nome della colonna |
Descrizione |
---|---|
ModelName |
Nome del modello sottoposto a test. |
AttributeName |
Nome della colonna stimabile. Per i modelli del cluster, è sempre null. |
AttributeState |
Valore di destinazione specificato nella colonna stimabile. Per i modelli del cluster, è sempre null.. |
PartitionIndex |
Indice in base 1 che identifica la partizione a cui si applicano i risultati. |
PartitionSize |
Valore integer che indica il numero di case inclusi in ogni partizione. |
Test |
Tipo di test eseguito. |
Measure |
Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo del valore stimabile. Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data mining). Per un elenco delle misure restituite per ogni tipo stimabile, vedere Report Convalida incrociata (Analysis Services - Data mining). |
Value |
Valore della misura di test specificata. |
Osservazioni
Per restituire la metrica di accuratezza per l'intero set di dati, utilizzare SystemGetClusterAccuracyResults (Analysis Services - Data mining).
Se il modello di data mining è già stato partizionato in riduzioni, è inoltre possibile ignorare l'elaborazione e restituire solo i risultati di convalida incrociata utilizzando SystemGetClusterAccuracyResults (Analysis Services - Data mining).
Esempi
Nell'esempio seguente viene illustrato come partizionare una struttura di data mining per la convalida incrociata in tre riduzioni, quindi come sottoporre a test due modelli di clustering associati alla struttura di data mining.
Nella terza riga del codice sono specificati i modelli di data mining che si desidera sottoporre a test. Se non si specifica l'elenco, vengono utilizzati tutti i modelli di clustering associati alla struttura.
Nella quarta riga del codice è specificato il numero di riduzioni, mentre nella quinta riga è specificato il numero massimo di case da utilizzare.
Poiché si tratta di modelli di clustering, non è necessario specificare un attributo o un valore stimabile.
CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)
Risultati dell'esempio:
ModelName |
AttributeName |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Measure |
Value |
---|---|---|---|---|---|---|---|
Cluster 1 |
|
|
1 |
3025 |
Clustering |
Probabilità del case |
0.930524511864121 |
Cluster 1 |
|
|
2 |
3025 |
Clustering |
Probabilità del case |
0.919184178430778 |
Cluster 1 |
|
|
3 |
3024 |
Clustering |
Probabilità del case |
0.929651120490248 |
Cluster 2 |
|
|
1 |
1289 |
Clustering |
Probabilità del case |
0.922789726933607 |
Cluster 2 |
|
|
2 |
1288 |
Clustering |
Probabilità del case |
0.934865535691068 |
Cluster 2 |
|
|
3 |
1288 |
Clustering |
Probabilità del case |
0.924724595688798 |
Requisiti
La convalida incrociata è disponibile solo in SQL Server Enterprise Edition a partire da SQL Server 2008.