Two-Class Bayes Point Machine
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Crea un modello di classificazione binaria Bayes Point Machine
Categoria: Machine Learning/Inizializza modello/classificazione
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Two-Class Bayes Point Machine in Machine Learning Studio (versione classica) per creare un modello di classificazione binaria senza training.
L'algoritmo in questo modulo usa un approccio bayesiano alla classificazione lineare denominato "Bayes Point Machine". Questo algoritmo approssima in modo efficiente la media bayesiana teoricamente ottimale dei classificatori lineari (in termini di prestazioni di generalizzazione) scegliendo un classificatore "medio", il Bayes Point. Trattandosi di un modello di classificazione bayesiano, Bayes Point Machine non è soggetto a overfitting rispetto ai dati di training.
Per altre informazioni, vedere il post di Chris Bishop nel blog microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference.
Come configurare Two-Class Bayes Point Machine
In Machine Learning Studio (versione classica) aggiungere il modulo Two-Class Bayes Point Machine all'esperimento. È possibile trovare il modulo in Machine Learning, Inizializza modello, Classificazione.
In Numero di iterazioni di training digitare un numero per specificare la frequenza con cui l'algoritmo di passaggio dei messaggi scorre i dati di training. In genere, il numero di iterazioni deve essere impostato su un valore compreso tra 5 e 100.
Maggiore è il numero di iterazioni di training, maggiore sarà l'accuratezza delle stime, anche se il training può risultare rallentato.
Per la maggior parte dei set di dati, l'impostazione predefinita di 30 iterazioni di training è sufficiente perché l'algoritmo produca stime accurate. In alcuni casi è possibile effettuare stime accurate con un numero inferiore di iterazioni. Per i set di dati con funzioni altamente correlate, un numero di iterazioni di training maggiore può risultare vantaggioso.
Selezionare l'opzione Includi distorsione se si vuole aggiungere una caratteristica costante o una distorsione a ogni istanza nel training e nella stima.
L'inserimento di una distorsione è necessario quando i dati non contengono già una funzione costante.
Selezionare l'opzione Consenti valori sconosciuti nelle funzionalità categoriche per creare un gruppo per i valori sconosciuti.
Se si deseleziona questa opzione, il modello può accettare solo i valori contenuti nei dati di training.
Se si seleziona questa opzione e si consentono valori sconosciuti, il modello potrebbe essere meno preciso per i valori noti, ma può fornire stime migliori per i nuovi valori (sconosciuti).
Aggiungere un'istanza del modulo Train Model e i dati di training.
Connessione i dati di training e l'output del modulo Two-Class Bayes Point Machine nel modulo Train Model (Train Model) e scegliere la colonna etichetta.
Eseguire l'esperimento.
Risultati
Al termine del training, fare clic con il pulsante destro del mouse sull'output del modulo Train Model (Train Model) per visualizzare i risultati:
Per visualizzare un riepilogo dei parametri del modello, insieme ai pesi delle funzionalità appresi dal training, selezionare Visualizza.
Per salvare il modello per un uso successivo, fare clic con il pulsante destro del mouse sull'output di Train MOdel (Train MOdel) e scegliere Save as Trained Model (Salva come modello con training).
Per eseguire stime, usare il modello con training come input per il modulo Score Model (Punteggio modello ).
Il modello senza training può anche essere passato al modello di convalida incrociata per la convalida incrociata rispetto a un set di dati con etichetta.
Esempio
Per vedere come viene usato Two-Class Bayes Point Machine in Machine Learning, vedere questi esperimenti di esempio nel Azure AI Gallery:
- Confronta classificatori binari: questo esempio illustra l'uso di più classificatori a due classi.
Note tecniche
Questa sezione contiene i dettagli di implementazione e le domande frequenti su questo algoritmo.
I dettagli della ricerca originale e della teoria sottostante sono disponibili in questo documento (PDF): Bayes Point Machines, di Herbert, Graepe e Campbell
Questa implementazione, tuttavia, migliora l'algoritmo originale in diversi modi:
Usa l'algoritmo di passaggio dei messaggi Expectation Propagation. Per altre informazioni, vedere Una famiglia di algoritmi per l'inferenza bayesiana approssimativa.
Non è necessario uno sweep dei parametri.
Questo metodo non richiede la normalizzazione dei dati.
Grazie a questi miglioramenti, il modello di classificazione Bayes Point Machine risulta più affidabile e più semplice da usare e consente di evitare il lungo passaggio di ottimizzazione dei parametri.
Parametri del modulo
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Number of training iterations | >=1 | Integer | 30 | Specificare il numero di iterazioni da usare durante il training |
Include bias | Qualsiasi | Boolean | True | Indica se deve essere aggiunta una funzione costante o una distorsione a ogni istanza |
Allow unknown values in categorical features | Qualsiasi | Boolean | True | Se True, crea un livello aggiuntivo per ogni colonna categorica. Tutti i livelli del set di dati di test non disponibili nel training set verranno mappati a questo livello aggiuntivo. |
Output
Nome | Tipo | Descrizione |
---|---|---|
Untrained model | ILearner interface | Modello di classificazione binaria senza training |