AutoMLStep Classe

Cria um passo do Pipeline do Azure ML que encapsula uma execução de ML automatizada.

Para obter um exemplo de utilização do AutoMLStep, consulte o bloco de notas https://aka.ms/pl-automl.

Inicialize um AutoMLStep.

Herança
AutoMLStep

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

Name Description
name
Necessário
str

O nome do passo.

automl_config
Necessário

Um objeto AutoMLConfig que define a configuração para esta execução de AutoML.

inputs

Uma lista de enlaces de porta de entrada.

Default value: None
outputs

Uma lista de enlaces de portas de saída.

Default value: None
script_repl_params

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

Default value: None
allow_reuse

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

Default value: True
version
str

Uma versão a atribuir ao passo.

Default value: None
hash_paths

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

Por predefinição, todos os ficheiros no parâmetro path em AutoMLConfig são transformados em hash, exceto os ficheiros listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo do passo de uma execução anterior.

Default value: None
enable_default_model_output

Indica se o melhor modelo será ou não adicionado como uma saída predefinida. Isto pode ser utilizado para obter o melhor modelo após a conclusão da execução com a AutoMLStepRun classe. Tenha em atenção que, se a saída do modelo predefinida não for necessária, recomenda-se que defina este parâmetro como False.

Default value: True
enable_default_metrics_output

Indica se todas as métricas de execução subordinadas serão ou não adicionadas como uma saída predefinida. Isto pode ser utilizado para obter as métricas de execução subordinadas após a execução ser concluída com a AutoMLStepRun classe. Tenha em atenção que, se a saída de métricas predefinida não for necessária, recomenda-se que defina este parâmetro como False.

Default value: True
name
Necessário
str

O nome do passo.

automl_config
Necessário

Um AutoMLConfig que define a configuração para esta execução de AutoML.

inputs
Necessário

Uma lista de enlaces de porta de entrada.

outputs
Necessário

Uma lista de enlaces de portas de saída.

script_repl_params
Necessário

Parâmetros opcionais a substituir num script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Necessário

Parâmetros opcionais a substituir num script.

allow_reuse
Necessário

Indica se o passo deve reutilizar os resultados anteriores ao executar novamente com as mesmas definições.

A reutilização está ativada por predefinição. Se o conteúdo do passo (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, o resultado da execução anterior deste passo será reutilizado. Ao reutilizar o passo, em vez de submeter a tarefa para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer passos subsequentes. Se utilizar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada e não se os dados subjacentes foram alterados.

version
Necessário
str

Uma versão a atribuir ao passo.

hash_paths
Necessário

PRETERIDO. Uma lista de caminhos para hash ao verificar se existem alterações nos conteúdos do passo de pipeline.

Por predefinição, todos os ficheiros no parâmetro path em AutoMLConfig são transformados em hash, exceto os ficheiros listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo do passo de uma execução anterior.

enable_default_model_output
Necessário

Indica se o melhor modelo será ou não adicionado como uma saída predefinida. Isto pode ser utilizado para obter o melhor modelo após a conclusão da execução com a AutoMLStepRun classe. Tenha em atenção que, se a saída do modelo predefinida não for necessária, recomenda-se que defina este parâmetro como False.

enable_default_metrics_output
Necessário

Indica se todas as métricas de execução subordinadas serão ou não adicionadas como uma saída predefinida. Isto pode ser utilizado para obter as métricas de execução subordinadas após a execução ser concluída com a AutoMLStepRun classe. Tenha em atenção que, se a saída de métricas predefinida não for necessária, recomenda-se que defina este parâmetro como False.

Observações

Com a classe AutoMLStep, pode executar o fluxo de trabalho de ML automatizado num pipeline do Azure Machine Learning. Os pipelines proporcionam benefícios como a repetibilidade, execuções automáticas, controlo e controlo de versões e modularidade para o fluxo de trabalho de ML automatizado. Para obter mais informações, veja O que são pipelines do Azure Machine Learning?.

Quando o fluxo de trabalho de ML automatizado estiver num pipeline, pode agendar o pipeline para ser executado com base num agendamento baseado no tempo ou numa agenda baseada em alterações. Os agendamentos baseados no tempo são úteis para tarefas de rotina, como monitorizar o desfasamento de dados, enquanto as agendas baseadas em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, a sua agenda pode consultar um arquivo de blobs onde os dados estão a ser carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registar uma nova versão do modelo assim que a execução estiver concluída. Para obter mais informações, veja Agendar pipelines de machine learning e Acionar uma execução de um pipeline do Machine Learning a partir de uma Aplicação Lógica.

O exemplo seguinte mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo seguinte mostra como utilizar o objeto AutoMLStep num Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo completo está disponível a partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo acima mostra um passo no pipeline. No entanto, ao utilizar o AutoMLStep num fluxo de trabalho de ML automatizado no mundo real, terá pelo menos um passo de pipeline que efetua a preparação de dados antes do AutoMLStep e outro passo de pipeline após esse registo do modelo. Por exemplo, este tipo de fluxo de trabalho, consulte o bloco de notas https://aka.ms/automl-retrain-pipeline.

Para gerir, verificar o estado e obter os detalhes de execução da execução do pipeline, utilize a AutoMLStepRun classe.

Para obter mais informações sobre machine learning automatizado no Azure, consulte o artigo O que é o machine learning automatizado?. Para obter mais informações sobre como configurar uma experimentação de ML automatizada sem utilizar um pipeline, veja o artigo Configurar a experimentação de ML automatizada no Python.

Métodos

create_node

Crie um nó a partir deste passo autoML e adicione ao gráfico especificado.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que represente o fluxo de trabalho.

create_node

Crie um nó a partir deste passo autoML e adicione ao gráfico especificado.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com este passo, o Azure ML transmite automaticamente os parâmetros necessários através deste método para que esse passo possa ser adicionado a um gráfico de pipeline que represente o fluxo de trabalho.

create_node(graph, default_datastore, context)

Parâmetros

Name Description
graph
Necessário

O objeto de grafo ao que adicionar o nó.

default_datastore
Necessário

O arquivo de dados predefinido.

context
Necessário
<xref:azureml.pipeline.core._GraphContext>

O contexto do gráfico.

Devoluções

Tipo Description

O nó criado.

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'