SystemGetClusterCrossValidationResults (Analysis Services - Data mining)

Partiziona la struttura di data mining nel numero di sezioni incrociate specificato, esegue il training di un modello per ogni partizione, quindi restituisce la metrica di accuratezza per ogni partizione.

Nota   Questa stored procedure può essere utilizzata solo con una struttura di data mining che contiene almeno un modello di clustering. Per eseguire la convalida incrociata di modelli non di clustering, è necessario utilizzare SystemGetCrossValidationResults (Analysis Services - Data mining).

Sintassi

SystemGetClusterCrossValidationResults(
<structure name>, 
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])

Argomenti

  • mining structure
    Nome di una struttura di data mining nel database corrente.

    (obbligatorio)

  • mining model list
    Elenco delimitato da virgole dei modelli di data mining da convalidare.

    Se non si specifica un elenco di modelli di data mining, la convalida incrociata viene eseguita su tutti i modelli di clustering associati alla struttura specificata.

    Nota

    Per eseguire la convalida incrociata di modelli non di clustering, è necessario utilizzare una stored procedure specifica, ovvero SystemGetCrossValidationResults (Analysis Services - Data mining).

    (facoltativo)

  • fold count
    Valore integer che specifica il numero di partizioni in cui separare il set di dati. Il valore minimo è 2. Il numero massimo di riduzioni è maximum integer o il numero di case, a seconda del valore inferiore.

    Ogni partizione conterrà all'incirca questo numero di case: max cases/fold count.

    Nessun valore predefinito.

    Nota

    Il numero di riduzioni influisce in modo significativo sul tempo richiesto per l'esecuzione della convalida incrociata. Se si seleziona un numero troppo elevato, l'esecuzione della query potrebbe richiedere molto tempo e in alcuni casi potrebbe verificarsi il blocco o il timeout del server.

    (obbligatorio)

  • max cases
    Valore integer che specifica il numero massimo di case che è possibile sottoporre a test.

    Il valore 0 indica che verranno utilizzati tutti i case nell'origine dati.

    Se si specifica un numero maggiore del numero effettivo di case presenti nel set di dati, verranno utilizzati tutti i case nell'origine dati.

    (obbligatorio)

  • test list
    Stringa che specifica le opzioni di testing.

    Nota   Questo parametro è riservato per utilizzi futuri.

    (facoltativo)

Tipo restituito

La tabella dei tipi restituiti contiene i punteggi per ogni singola partizione e le aggregazioni per tutti i modelli.

Nella tabella seguente vengono descritte le colonne restituite.

Nome della colonna

Descrizione

ModelName

Nome del modello sottoposto a test.

AttributeName

Nome della colonna stimabile. Per i modelli del cluster, è sempre null.

AttributeState

Valore di destinazione specificato nella colonna stimabile. Per i modelli del cluster, è sempre null..

PartitionIndex

Indice in base 1 che identifica la partizione a cui si applicano i risultati.

PartitionSize

Valore integer che indica il numero di case inclusi in ogni partizione.

Test

Tipo di test eseguito.

Measure

Nome della misura restituita dal test. Le misure per ogni modello dipendono dal tipo del valore stimabile. Per una definizione di ogni misura, vedere Convalida incrociata (Analysis Services - Data mining).

Per un elenco delle misure restituite per ogni tipo stimabile, vedere Report Convalida incrociata (Analysis Services - Data mining).

Value

Valore della misura di test specificata.

Osservazioni

Per restituire la metrica di accuratezza per l'intero set di dati, utilizzare SystemGetClusterAccuracyResults (Analysis Services - Data mining).

Se il modello di data mining è già stato partizionato in riduzioni, è inoltre possibile ignorare l'elaborazione e restituire solo i risultati di convalida incrociata utilizzando SystemGetClusterAccuracyResults (Analysis Services - Data mining).

Esempi

Nell'esempio seguente viene illustrato come partizionare una struttura di data mining per la convalida incrociata in tre riduzioni, quindi come sottoporre a test due modelli di clustering associati alla struttura di data mining.

Nella terza riga del codice sono specificati i modelli di data mining che si desidera sottoporre a test. Se non si specifica l'elenco, vengono utilizzati tutti i modelli di clustering associati alla struttura.

Nella quarta riga del codice è specificato il numero di riduzioni, mentre nella quinta riga è specificato il numero massimo di case da utilizzare.

Poiché si tratta di modelli di clustering, non è necessario specificare un attributo o un valore stimabile.

CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)

Risultati dell'esempio:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Value

Cluster 1

 

 

1

3025

Clustering

Probabilità del case

0.930524511864121

Cluster 1

 

 

2

3025

Clustering

Probabilità del case

0.919184178430778

Cluster 1

 

 

3

3024

Clustering

Probabilità del case

0.929651120490248

Cluster 2

 

 

1

1289

Clustering

Probabilità del case

0.922789726933607

Cluster 2

 

 

2

1288

Clustering

Probabilità del case

0.934865535691068

Cluster 2

 

 

3

1288

Clustering

Probabilità del case

0.924724595688798

Requisiti

La convalida incrociata è disponibile solo in SQL Server Enterprise Edition a partire da SQL Server 2008.