Permutation Feature Importance (Importanza caratteristica permutazione)

Questo articolo descrive come usare il componente Importanza funzionalità permutazione nella finestra di progettazione di Azure Machine Learning per calcolare un set di punteggi di importanza delle funzionalità per il set di dati. Questi punteggi vengono usati per determinare le funzionalità migliori da usare in un modello.

In questo componente, i valori delle funzionalità vengono casualmente casualmente casuali, una colonna alla volta. Le prestazioni del modello sono misurate prima e dopo. È possibile scegliere una delle metriche standard per misurare le prestazioni.

I punteggi restituiti dal componente rappresentano la modifica delle prestazioni di un modello sottoposto a training, dopo la permutazione. Le funzionalità importanti sono in genere più sensibili al processo di shuffling, quindi generano punteggi di priorità più elevati.

Questo articolo offre una panoramica della funzionalità di permutazione, della base teorica e delle relative applicazioni in Machine Learning: Permutation Feature Importance.This article provides an overview of the permutation feature, its theoretical basis, and its applications in Machine Learning: Permutation Feature Importance.

Come usare l'importanza della funzionalità permutazione

Per generare un set di punteggi di funzionalità è necessario disporre di un modello già sottoposto a training, nonché di un set di dati di test.

  1. Aggiungere il componente Importanza funzionalità permutazione alla pipeline. È possibile trovare questo componente nella categoria Selezione funzionalità.

  2. Connettere un modello sottoposto a training all'input sinistro. Il modello deve essere un modello di regressione o un modello di classificazione.

  3. Nell'input destro connettere un set di dati. Preferibilmente, scegliere uno diverso dal set di dati usato per il training del modello. Questo set di dati viene usato per l'assegnazione dei punteggi in base al modello sottoposto a training. Viene usato anche per valutare il modello dopo la modifica dei valori delle funzionalità.

  4. Per Valore di inizializzazione casuale immettere un valore da usare come valore di inizializzazione per la casualizzazione. Se si specifica 0 (impostazione predefinita), viene generato un numero in base all'orologio di sistema.

    Un valore di inizializzazione è facoltativo, ma è necessario fornire un valore se si vuole riproducibilità tra le esecuzioni della stessa pipeline.

  5. Per Metrica per misurare le prestazioni, selezionare una singola metrica da usare quando si calcola la qualità del modello dopo la permutazione.

    La finestra di progettazione di Azure Machine Learning supporta le metriche seguenti, a seconda che si stia valutando un modello di classificazione o regressione:

    • Valutazione

      Accuratezza, precisione, richiamo

    • Regressionee

      Precisione, richiamo, errore assoluto medio, errore quadratico medio radice, errore assoluto relativo, errore quadratico relativo, coefficiente di determinazione

    Per una descrizione più dettagliata di queste metriche di valutazione e del modo in cui vengono calcolate, vedere Evaluate Model (Valuta modello).

  6. Inviare la pipeline.

  7. Il componente restituisce un elenco di colonne di funzionalità e i punteggi associati. L'elenco viene classificato in ordine decrescente dei punteggi.

Note tecniche

L'importanza della funzionalità di permutazione funziona modificando in modo casuale i valori di ogni colonna di funzionalità, una colonna alla volta. Valuta quindi il modello.

Le classificazioni fornite dal componente sono spesso diverse da quelle ottenute dalla selezione delle funzionalità basate su filtro. La selezione delle funzionalità basata su filtro calcola i punteggi prima della creazione di un modello.

Il motivo della differenza è che Permutation Feature Importance non misura l'associazione tra una funzionalità e un valore di destinazione. Acquisisce invece la quantità di influenza di ogni funzionalità sulle stime del modello.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.