Pontuar o modelo Vowpal Wabbit

Este artigo descreve como usar o componente Pontuar o Modelo Vowpal Wabbit no designer do Azure Machine Learning, para gerar pontuações de um conjunto de dados de entrada, usando um modelo Vowpal Wabbit treinado existente.

Este componente fornece a versão mais recente da estrutura de Vowpal Wabbit, versão 8.8.1. Use este componente para pontuar dados usando um modelo treinado salvo no formato VW versão 8.

Como configurar Pontuar o Modelo Vowpal Wabbit

  1. Adicione o componente Pontuar o Modelo Vowpal Wabbit ao seu experimento.

  2. Adicione um modelo Vowpal Wabbit treinado e conecte-o à porta de entrada à esquerda. Você pode usar um modelo treinado criado no mesmo experimento ou localizar um modelo salvo na categoria Conjuntos de dados do painel de navegação esquerdo do designer. No entanto, o modelo deve estar disponível no Designer do Azure Machine Learning.

    Observação

    Há suporte apenas para modelos Vowpal Wabbit 8.8.1; Você não pode conectar modelos salvos que foram treinados usando outros algoritmos.

  3. Adicione o conjunto de dados de teste e conecte-o à porta de entrada à direita. Se o conjunto de dados de teste for um diretório que contém o arquivo de dados de teste, especifique o nome do arquivo de dados de teste com o Nome do arquivo de dados de teste. Se o conjunto de dados de teste for um único arquivo, deixe Nome do arquivo de dados de teste vazio.

  4. Na caixa de texto Argumentos de VW, digite um conjunto de argumentos de linha de comando válidos para o executável do Vowpal Wabbit.

    Para obter informações sobre quais argumentos do Vowpal Wabbit têm suporte e não têm suporte no Azure Machine Learning, consulte a seção Notas Técnicas.

  5. Nome do arquivo de dados de teste: digite o nome do arquivo que contém os dados de entrada. Esse argumento só é usado quando o conjunto de dados de teste é um diretório.

  6. Especificar tipo de arquivo: indique qual formato seus dados de treinamento usam. O Vowpal Wabbit permite esses dois formatos de arquivo de entrada:

    • VW representa o formato interno usado pelo Vowpal Wabbit. Confira a página wiki do Vowpal Wabbit para obter detalhes.
    • SVMLight é um formato usado por outras ferramentas de aprendizado de máquina.
  7. Selecione a opção Incluir uma coluna extra que contém rótulos, se você quiser gerar rótulos junto com as pontuações.

    Normalmente, ao manipular dados de texto, o Vowpal Wabbit não exige rótulos e retornará apenas as pontuações para cada linha de dados.

  8. Selecione a opção Incluir uma coluna extra contendo pontuações brutas, se você quiser gerar pontuações brutas junto com os resultados.

  9. Enviar o pipeline.

Resultados

Após a conclusão do treinamento:

  • Para visualizar os resultados, clique com o botão direito do mouse na saída do componente Pontuar o Modelo Vowpal Wabbit. A saída indica uma pontuação de previsão normalizada de 0 a 1.

  • Para avaliar os resultados, o conjunto de dados de saída deve conter nomes de coluna de pontuação específicos, que atendem aos requisitos do componente Avaliar Modelo.

    • Para a tarefa de regressão, o conjunto de dados a ser avaliado precisa ter uma coluna, denominada Regression Scored Labels, que representa rótulos pontuados.
    • Para a tarefa de classificação binária, o conjunto de dados a ser avaliado precisa ter duas colunas, chamadas Binary Class Scored Labels,Binary Class Scored Probabilities, que representam rótulos pontuados e probabilidades, respectivamente.
    • Para a tarefa de várias classificações, o conjunto de dados a ser avaliado precisa ter uma coluna, denominada Multi Class Scored Labels, que representa rótulos pontuados.

    Observe que os resultados do componente Pontuar o Modelo Vowpal Wabbit não podem ser avaliados diretamente. Antes de avaliar, o conjuntos de dados deve ser modificado de acordo com os requisitos acima.

Observações técnicas

Essa seção contém detalhes de implementação, dicas e respostas para perguntas frequentes.

Parâmetros

O Vowpal Wabbit tem muitas opções de linha de comando para escolher e ajustar algoritmos. Uma discussão completa sobre essas opções não é possível aqui; recomendamos que você exiba a Página Wiki Vowpal Wabbit.

Os parâmetros a seguir não têm suporte no Azure Machine Learning Studio (clássico).

  • As opções de entrada/saída especificadas em https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Essas propriedades já estão configuradas automaticamente pelo componente.

  • Além disso, qualquer opção que gera várias saídas ou usa várias entradas não é permitida. Elas incluem --cbt, --lda e --wap.

  • Há compatibilidade apenas com algoritmos de aprendizado supervisionados. Isso não permite estas opções: –active, --rank, --search etc.

Todos os argumentos que não sejam os descritos acima são permitidos.

Próximas etapas

Confira o conjunto de componentes disponíveis no Azure Machine Learning.