Assegnare punteggi al modello Vowpal Wabbit

Questo articolo descrive come usare il componente Score Vowpal Wabbit Model nella finestra di progettazione di Azure Machine Learning per generare punteggi per un set di dati di input usando un modello Vowpal Wabbit con training esistente.

Questo componente fornisce la versione più recente del framework Vowpal Wabbit, versione 8.8.1. Usare questo componente per assegnare punteggi ai dati usando un modello sottoposto a training salvato nel formato VW versione 8.

Come configurare score Vowpal Wabbit Model

  1. Aggiungere il componente Score Vowpal Wabbit Model all'esperimento.

  2. Aggiungere un modello Vowpal Wabbit sottoposto a training e connetterlo alla porta di input a sinistra. È possibile usare un modello sottoposto a training creato nello stesso esperimento oppure individuare un modello salvato nella categoria Set di dati del riquadro di spostamento sinistro della finestra di progettazione. Tuttavia, il modello deve essere disponibile in Progettazione Azure Machine Learning.

    Nota

    Sono supportati solo i modelli Vowpal Wabbit 8.8.1; non è possibile connettere i modelli salvati sottoposti a training usando altri algoritmi.

  3. Aggiungere il set di dati di test e connetterlo alla porta di input a destra. Se il set di dati di test è una directory che contiene il file di dati di test, specificare il nome del file di dati di test con nome del file di dati di test. Se il set di dati di test è un singolo file, lasciare Vuoto il nome del file di dati di test.

  4. Nella casella di testo Argomenti VW digitare un set di argomenti della riga di comando validi per l'eseguibile Vowpal Wabbit.

    Per informazioni sugli argomenti di Vowpal Wabbit supportati e non supportati in Azure Machine Learning, vedere la sezione Note tecniche.

  5. Nome del file di dati di test: digitare il nome del file che contiene i dati di input. Questo argomento viene usato solo quando il set di dati di test è una directory.

  6. Specificare il tipo di file: indicare il formato usato dai dati di training. Vowpal Wabbit supporta questi due formati di file di input:

    • VW rappresenta il formato interno utilizzato da Vowpal Wabbit. Per informazioni dettagliate, vedere la pagina wiki di Vowpal Wabbit.
    • SVMLight è un formato usato da altri strumenti di Machine Learning.
  7. Selezionare l'opzione Includi una colonna aggiuntiva contenente etichette, se si desidera restituire etichette insieme ai punteggi.

    In genere, quando si gestiscono dati di testo, Vowpal Wabbit non richiede etichette e restituisce solo i punteggi per ogni riga di dati.

  8. Selezionare l'opzione Includi una colonna aggiuntiva contenente punteggi non elaborati, se si desidera restituire i punteggi non elaborati insieme ai risultati.

  9. Inviare la pipeline.

Risultati

Al termine del training:

  • Per visualizzare i risultati, fare clic con il pulsante destro del mouse sull'output del componente Score Vowpal Wabbit Model .To visualize the results, right-click the output of the Score Vowpal Wabbit Model component. L'output indica un punteggio di stima normalizzato da 0 a 1.

  • Per valutare i risultati, il set di dati di output deve contenere nomi di colonna di punteggio specifici, che soddisfano i requisiti del componente Evaluate Model.

    • Per l'attività di regressione, il set di dati da valutare deve avere una colonna denominata , che Regression Scored Labelsrappresenta le etichette con punteggio.
    • Per l'attività di classificazione binaria, il set di dati da valutare deve avere due colonne, denominate Binary Class Scored Labels,Binary Class Scored Probabilities che rappresentano rispettivamente etichette con punteggio e probabilità.
    • Per l'attività di classificazione multipla, il set di dati da valutare deve avere una colonna, denominata Multi Class Scored Labels, che rappresenta le etichette con punteggio.

    Si noti che i risultati del componente Score Vowpal Wabbit Model non possono essere valutati direttamente. Prima di valutare, il set di dati deve essere modificato in base ai requisiti precedenti.

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Parametri

Vowpal Wabbit offre molte opzioni della riga di comando per la scelta e l'ottimizzazione degli algoritmi. Una discussione completa di queste opzioni non è possibile qui; è consigliabile visualizzare la pagina wiki di Vowpal Wabbit.

I parametri seguenti non sono supportati in Azure Machine Learning Studio (versione classica).

  • Opzioni di input/output specificate in https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Queste proprietà sono già configurate automaticamente dal componente.

  • Inoltre, qualsiasi opzione che genera più output o accetta più input non è consentita. Questi includono --cbt, --ldae --wap.

  • Sono supportati solo algoritmi di apprendimento supervisionati. Questa opzione non consente queste opzioni: –active, e --rank--search così via.

Sono consentiti tutti gli argomenti diversi da quelli descritti in precedenza.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.