Esplorazione del modello Naive Bayes (Esercitazione di base sul data mining)
L'algoritmo Microsoft Naive Bayes fornisce diversi metodi per la visualizzazione dell'interazione tra l'acquisto di biciclette e gli attributi di input.
Per l'esplorazione di modelli di data mining Naive Bayes, nel Visualizzatore Microsoft Naive Bayes sono disponibili le schede seguenti:
Dependency Network
Attribute Profiles
Attribute Characteristics
Attribute Discrimination
Nelle sezioni seguenti viene descritto come esaminare gli altri modelli di data mining.
Rete di dipendenze
La scheda Rete di dipendenze funziona in modo analogo alla scheda Rete di dipendenze del Visualizzatore Microsoft Decision Trees. Ogni nodo nel visualizzatore rappresenta un attributo e le righe tra i nodi rappresentano le relazioni. Nel visualizzatore è possibile osservare tutti gli attributi che influiscono sullo stato dell'attributo stimabile, ovvero Bike Buyer.
Per esplorare il modello nella scheda Rete di dipendenze
Utilizzare l'elenco Modello di data mining nella parte superiore della scheda Visualizzatore modello di data mining per passare al modello TM_NaiveBayes.
Utilizzare l'elenco Visualizzatore per passare a Visualizzatore Microsoft Naive Bayes.
Fare clic sul nodo Bike Buyer per identificarne le dipendenze.
L'ombreggiatura rosa indica che tutti gli attributi influenzano l'acquisto di biciclette.
Regolare il dispositivo di scorrimento per identificare l'attributo più influente.
Spostando verso il basso il dispositivo di scorrimento rimangono visibili solo gli attributi che incidono maggiormente sulla colonna [Bike Buyer]. Se si sposta il dispositivo di scorrimento è possibile verificare che alcuni degli attributi più influenti sono il numero di automobili possedute, la distanza dal luogo di lavoro e il numero complessivo di figli.
Torna all'inizio
Profili attributo
La scheda Profili attributo descrive l'influenza dei diversi stati degli attributi di input sul risultato dell'attributo stimabile.
Per esplorare il modello nella scheda Profili attributo
Nella casella Stimabile verificare che Bike Buyer sia selezionato.
Se Legenda data mining blocca la visualizzazione di Profili attributo, spostare la legenda.
Nella casella Barre istogramma selezionare 5.
Nel modello utilizzato in questo esempio 5 è il numero massimo di stati per ogni singola variabile.
Gli attributi che influiscono sullo stato di questo attributo stimabile vengono elencati in combinazione con i valori di ogni stato degli attributi di input e la loro distribuzione in ogni stato dell'attributo stimabile.
Nella colonna Attributi individuare Number Cars Owned. Si notino le differenze negli istogrammi tra gli acquirenti di biciclette (la colonna con etichetta 1) e i non acquirenti (la colonna con etichetta 0). È molto più probabile che una bicicletta venga acquistata da una persona priva di automobili o che ne possiede una sola.
Fare doppio clic sulla cella Number Cars Owned nella colonna degli acquirenti di biciclette (la colonna con etichetta 1).
Legenda data mining mostra una vista più dettagliata.
Torna all'inizio
Caratteristiche attributo
La scheda Caratteristiche attributo consente di selezionare un attributo e un valore per verificare la frequenza di visualizzazione di altri attributi per il valore selezionato.
Per esplorare il modello nella scheda Caratteristiche attributo
Nell'elenco Attributo verificare che Bike Buyer sia selezionato.
Impostare Valore su 1.
Nel visualizzatore si osserverà che è più probabile che una bicicletta venga acquistata dai clienti senza figli, che abitano a breve distanza dal luogo di lavoro e che vivono nell'area dell'America del nord.
Torna all'inizio
Analisi discriminante attributi
La scheda Analisi discriminante attributi consente di esaminare le relazioni tra due valori discreti dell'acquisto di biciclette e altri valori dell'attributo. Dato che il modello TM_NaiveBayes ha solo due stati, 1 e 0, non è necessario apportare alcuna modifica al visualizzatore.
Nel visualizzatore è possibile osservare che le persone che non possiedono un'automobile tendenzialmente acquistano biciclette, mentre le persone che possiedono due automobili in genere non ne acquistano.
Attività precedente della lezione
Esplorazione del modello di clustering (Esercitazione di base sul data mining)
Vedere anche