Scegliere la colonna da utilizzare per il test di un modello di data mining

Articolo
07/30/2013

Prima di poter misurare l'accuratezza di un modello di data mining, è necessario decidere quale risultato si desidera valutare. La maggior parte dei modelli di data mining richiede che si scelga almeno una colonna da utilizzare come attributo stimabile quando si crea il modello. Pertanto, quando si testa l'accuratezza del modello, è in genere necessario selezionare quell'attributo da testare.

Nell'elenco seguente vengono descritte alcune considerazioni aggiuntive relative alla scelta dell'attributo stimabile da utilizzare nel test:

Alcuni tipi di modelli di data mining possono stimare più attributi, ad esempio reti neurali che possono esplorare le relazioni tra molti attributi.
Altri tipi di modelli di data mining, ad esempio i modelli di clustering, non dispongono necessariamente di un attributo stimabile. Non è possibile testare i modelli di clustering a meno che non dispongano di un attributo stimabile.
Per creare un grafico a dispersione o misurare l'accuratezza di un modello di regressione è necessario scegliere un attributo stimabile continuo come risultato. In questo caso, non è possibile specificare un valore di destinazione. Se si crea un qualsiasi grafico che non sia a dispersione, la colonna della struttura di data mining sottostante deve disporre anche di un tipo di contenuto Discreto o Discretizzato.
Se si sceglie un attributo discreto come risultato stimabile, è anche possibile specificare un valore di destinazione oppure lasciare vuoto il campo Valore stima. Se si include un Valore stima, il grafico misurerà unicamente l'efficacia del modello alla stima del valore di destinazione. Se non si specifica un risultato di destinazione, il modello viene misurato per l'accuratezza alla stima di tutti i risultati.
Se si desidera includere più modelli e confrontarli in un singolo grafico di accuratezza, tutti i modelli devono utilizzare la stessa colonna stimabile.
Quando si crea un report di convalida incrociata, in Analysis Services verranno automaticamente analizzati tutti i modelli che includono lo stesso attributo stimabile.
Quando viene selezionata l'opzione Sincronizza colonne e valori di stima, in Analysis Services vengono scelte automaticamente le colonne stimabili aventi stessi nomi e tipi di dati corrispondenti. Se le colonne non soddisfano questi criteri, è possibile disabilitare questa opzione e scegliere manualmente una colonna stimabile. Potrebbe essere necessario eseguire questa operazione per il test del modello con un set di dati esterni che dispone di colonne diverse rispetto al modello. Se tuttavia si sceglie una colonna con il tipo di dati errato si verificherà un errore o si otterranno risultati non corretti.

Specificare il risultato da stimare

Fare doppio clic sulla struttura di data mining per aprirla in Progettazione modelli di data mining.
Selezionare la scheda Grafico di accuratezza modello di data mining.
Selezionare la scheda Selezione input.
In Nome colonna stimabile nella scheda Selezione input selezionare una colonna stimabile per ogni modello che si include nel grafico.

Le colonne del modello di data mining disponibili nella casella Nome colonna stimabile sono limitate alle colonne con il tipo di utilizzo impostato su PREDICT o PREDICT ONLY.
Se si desidera determinare il livello di accuratezza per un modello, è necessario selezionare un risultato specifico da misurare nell'elenco Valore stima.

Condividi tramite

Scegliere la colonna da utilizzare per il test di un modello di data mining

Specificare il risultato da stimare

Vedere anche

Attivitá

Concetti

Risorse aggiuntive