Componente macchina a vettori di supporto a due classi

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello basato sull'algoritmo della macchina a vettori di supporto.

Le macchine a vettori di supporto (SVM) sono una classe ben ricercata di metodi di apprendimento supervisionati. Questa particolare implementazione è adatta alla stima di due possibili risultati, in base a variabili continue o categoriche.

Dopo aver definito i parametri del modello, eseguire il training del modello usando i componenti di training e fornire un set di dati con tag che include un'etichetta o una colonna del risultato.

Informazioni sulle macchine vettoriali di supporto

Le macchine a vettori di supporto sono tra le prime degli algoritmi di Machine Learning e i modelli SVM sono stati usati in molte applicazioni, dal recupero delle informazioni alla classificazione di testo e immagini. Le macchine virtuali di avvio possono essere usate sia per le attività di classificazione che per le attività di regressione.

Questo modello SVM è un modello di apprendimento supervisionato che richiede dati etichettati. Nel processo di training, l'algoritmo analizza i dati di input e riconosce i modelli in uno spazio di funzionalità multidimensionale denominato iperpiano. Tutti gli esempi di input sono rappresentati come punti in questo spazio e vengono mappati alle categorie di output in modo che le categorie siano divise per il più ampio e cancellare un gap il più possibile.

Per la stima, l'algoritmo SVM assegna nuovi esempi in una categoria o nell'altra, mappandoli nello stesso spazio.

Modalità di configurazione

Per questo tipo di modello, è consigliabile normalizzare il set di dati prima di usarlo per eseguire il training del classificatore.

  1. Aggiungere il componente Macchina a vettori di supporto a due classi alla pipeline.

  2. Specificare la modalità di training del modello impostando l'opzione Crea modalità di training.

    • Singolo parametro: se si sa come configurare il modello, è possibile specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: se non si è certi dei parametri migliori, è possibile trovare i parametri ottimali usando il componente Ottimizza iperparametri del modello. È possibile fornire un intervallo di valori e il formatore esegue l'iterazione su più combinazioni delle impostazioni per determinare la combinazione di valori che producono il risultato migliore.

  3. In Number of iterations (Numero di iterazioni) digitare un numero che indica il numero di iterazioni usate durante la compilazione del modello.

    Questo parametro può essere usato per controllare il compromesso tra velocità di training e accuratezza.

  4. Per Lambda digitare un valore da usare come peso per la regolarizzazione L1.

    Questo coefficiente di regolarizzazione può essere usato per ottimizzare il modello. I valori più grandi penalizzano i modelli più complessi.

  5. Selezionare l'opzione Normalizza funzionalità se si desidera normalizzare le funzionalità prima del training.

    Se si applica la normalizzazione, prima del training, i punti dati vengono centrati sulla media e ridimensionati per avere un'unità di deviazione standard.

  6. Selezionare l'opzione Project to the unit sphere (Progetto nella sfera unità) per normalizzare i coefficienti.

    Proiettando i valori nello spazio unità, prima del training, i punti dati vengono centrati a 0 e ridimensionati per avere un'unità di deviazione standard.

  7. In Valore di inizializzazione numero casuale digitare un valore intero da usare come valore di inizializzazione se si vuole garantire la riproducibilità tra le esecuzioni. In caso contrario, un valore di clock di sistema viene usato come valore di inizializzazione, che può comportare risultati leggermente diversi tra le esecuzioni.

  8. Connettere un set di dati etichettato ed eseguire il training del modello:

    • Se si imposta Create trainer mode (Crea modalità trainer) su Single Parameter (Parametro singolo), connettere un set di dati con tag e il componente Train Model (Train Model ).

    • Se si imposta La modalità di training su Intervallo di parametri, connettere un set di dati con tag ed eseguire il training del modello usando Ottimizzazione degli iperparametri del modello.

    Nota

    Se si passa un intervallo di parametri a Train Model, viene usato solo il valore predefinito nell'elenco dei singoli parametri.

    Se si passa un singolo set di valori di parametro al componente Tune Model Hyperparameters , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per lo strumento di apprendimento.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

  9. Inviare la pipeline.

Risultati

Al termine del training:

  • Per salvare uno snapshot del modello sottoposto a training, selezionare la scheda Output nel pannello destro del componente Train model (Esegui training modello). Selezionare l'icona Registra set di dati per salvare il modello come componente riutilizzabile.

  • Per usare il modello per l'assegnazione dei punteggi, aggiungere il componente Score Model a una pipeline.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.