Select Columns Transform (Seleziona trasformazione colonne)

Questo articolo descrive come usare il componente Select Columns Transform nella finestra di progettazione di Azure Machine Learning. Lo scopo del componente Select Columns Transform è garantire che un set di colonne prevedibile e coerente venga usato nelle operazioni di Machine Learning downstream.

Questo componente è utile per attività quali l'assegnazione dei punteggi, che richiedono colonne specifiche. Le modifiche nelle colonne disponibili potrebbero interrompere la pipeline o modificare i risultati.

Usare Select Columns Transform (Seleziona trasformazione colonne) per creare e salvare un set di colonne. Usare quindi il componente Applica trasformazione per applicare tali selezioni ai nuovi dati.

Come usare Select Columns Transform

Questo scenario presuppone che si voglia usare la selezione delle funzionalità per generare un set dinamico di colonne che verranno usate per il training di un modello. Per assicurarsi che le selezioni di colonna siano le stesse per il processo di assegnazione dei punteggi, usare il componente Select Columns Transform (Seleziona trasformazione colonne) per acquisire le selezioni delle colonne e applicarle altrove nella pipeline.

  1. Aggiungere un set di dati di input alla pipeline nella finestra di progettazione.

  2. Aggiungere un'istanza di Selezione funzionalità basata su filtro.

  3. Connettere i componenti e configurare il componente di selezione delle funzionalità per trovare automaticamente una serie di funzionalità migliori nel set di dati di input.

  4. Aggiungere un'istanza di Train Model e usare l'output di Filter Based Feature Selection come input per il training.

    Importante

    Poiché l'importanza della funzionalità si basa sui valori nella colonna, non è possibile sapere in anticipo quali colonne potrebbero essere disponibili per l'input per il training del modello.

  5. Collegare un'istanza del componente Seleziona trasformazione colonne.

    Questo passaggio genera una selezione di colonna come trasformazione che può essere salvata o applicata ad altri set di dati. Questo passaggio garantisce che le colonne identificate nella selezione delle funzionalità vengano salvate per il riutilizzo di altri componenti.

  6. Aggiungere il componente Score Model (Punteggio modello ).

    Non connettere il set di dati di input. Aggiungere invece il componente Applica trasformazione e connettere l'output della trasformazione di selezione delle funzionalità.

    La struttura della pipeline dovrebbe essere simile alla seguente:

    Pipeline di esempio

    Importante

    Non è possibile aspettarsi di applicare la selezione delle funzionalità basate su filtro al set di dati di assegnazione dei punteggi e ottenere gli stessi risultati. Poiché la selezione delle funzionalità è basata sui valori, potrebbe scegliere un set diverso di colonne, che causerebbe l'esito negativo dell'operazione di assegnazione dei punteggi.

  7. Inviare la pipeline.

Questo processo di salvataggio e applicazione di una selezione di colonne garantisce che lo stesso schema di dati sia disponibile per il training e l'assegnazione dei punteggi.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.