Componente Regressione logistica multiclasse

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per creare un modello di regressione logistica che può essere usato per stimare più valori.

La classificazione che usa la regressione logistica è un metodo di apprendimento supervisionato e quindi richiede un set di dati etichettato. Per eseguire il training del modello, fornire il modello e il set di dati etichettato come input a un componente, ad esempio Train Model. Il modello sottoposto a training può quindi essere usato per stimare i valori per i nuovi esempi di input.

Azure Machine Learning offre anche un componente Di regressione logistica a due classi, adatto per la classificazione di variabili binarie o dicotomie.

Informazioni sulla regressione logistica multiclasse

La regressione logistica è un metodo noto nelle statistiche che viene usato per stimare la probabilità di un risultato ed è diffuso per le attività di classificazione. L'algoritmo stima la probabilità di occorrenza di un evento adattando i dati a una funzione logistica.

Nella regressione logistica multiclasse, il classificatore può essere usato per stimare più risultati.

Configurare una regressione logistica multiclasse

  1. Aggiungere il componente Regressione logistica multiclasse alla pipeline.

  2. Specificare la modalità di training del modello impostando l'opzione Crea modalità di training.

    • Singolo parametro: usare questa opzione se si sa come configurare il modello e specificare un set specifico di valori come argomenti.

    • Intervallo di parametri: selezionare questa opzione se non si è certi dei parametri migliori e si vuole eseguire uno sweep di parametri. Selezionare un intervallo di valori per scorrere e ottimizzare gli iperparametri del modello esegue l'iterazione su tutte le possibili combinazioni delle impostazioni fornite per determinare gli iperparametri che producono i risultati ottimali.

  3. Tolleranza di ottimizzazione, specificare il valore soglia per la convergenza dell'utilità di ottimizzazione. Se il miglioramento tra iterazioni è inferiore alla soglia, l'algoritmo si arresta e restituisce il modello corrente.

  4. Peso regolarizzazione L1, peso regolarizzazione L2: digitare un valore da utilizzare per i parametri di regolarizzazione L1 e L2. Per entrambi è consigliabile un valore diverso da zero.

    La regolarizzazione è un metodo per prevenire l'overfitting penalizzando i modelli con valori di coefficiente estremi. La regolarizzazione funziona aggiungendo la penalità associata ai valori dei coefficienti all'errore dell'ipotesi. Un modello accurato con valori di coefficiente estremi sarebbe penalizzato di più, mentre un modello meno accurato con valori più conservativi sarebbe penalizzato di meno.

    La regolarizzazione L1 e L2 hanno effetti e usi diversi. L1 può essere applicato a modelli di tipo sparse, che è utile quando si utilizzano dati ad alta dimensione. Al contrario, la regolarizzazione L2 è preferibile per i dati che non sono di tipo sparse. Questo algoritmo supporta una combinazione lineare di valori di regolarizzazione L1 e L2, ovvero se x = L1 e y = L2, ax + by = c definisce l'intervallo lineare dei termini di regolarizzazione.

    Sono state concepite diverse combinazioni lineari di termini L1 e L2 per i modelli di regressione logistica, ad esempio la regolarizzazione della rete elastica.

  5. Valore di inizializzazione numero casuale: digitare un valore intero da usare come valore di inizializzazione per l'algoritmo se si desidera che i risultati siano ripetibili durante le esecuzioni. In caso contrario, come valore di clock di sistema viene usato come valore di inizializzazione, che può produrre risultati leggermente diversi nelle esecuzioni della stessa pipeline.

  6. Connettere un set di dati etichettato ed eseguire il training del modello:

    • Se si imposta Create trainer mode (Crea modalità trainer) su Single Parameter (Parametro singolo), connettere un set di dati con tag e il componente Train Model (Train Model ).

    • Se si imposta La modalità di training su Intervallo di parametri, connettere un set di dati con tag ed eseguire il training del modello usando Ottimizzazione degli iperparametri del modello.

    Nota

    Se si passa un intervallo di parametri a Train Model, viene usato solo il valore predefinito nell'elenco dei singoli parametri.

    Se si passa un singolo set di valori di parametro al componente Tune Model Hyperparameters , quando prevede un intervallo di impostazioni per ogni parametro, ignora i valori e usa i valori predefiniti per lo strumento di apprendimento.

    Se si seleziona l'opzione Intervallo di parametri e si immette un singolo valore per qualsiasi parametro, tale singolo valore specificato viene usato durante lo sweep, anche se altri parametri cambiano in un intervallo di valori.

  7. Inviare la pipeline.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.