OutputPortBinding Classe
Define uma saída nomeada de uma etapa de pipeline.
OutputPortBinding pode ser usado para especificar o tipo de dados que serão produzidos por uma etapa e como os dados serão produzidos. Ele pode ser usado com InputPortBinding para especificar que a saída da etapa é uma entrada necessária de outra etapa.
Inicialize OutputPortBinding.
- Herança
-
builtins.objectOutputPortBinding
Construtor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parâmetros
Nome | Description |
---|---|
name
Obrigatório
|
Nome do objeto OutputPortBinding, que pode conter apenas letras, dígitos e sublinhados. |
datastore
|
O Armazenamento de Dados no qual o PipelineData residirá. Valor padrão: None
|
output_name
|
Nome da saída, se o nome None for usado. Pode conter apenas letras, dígitos e sublinhados. Valor padrão: None
|
bind_mode
|
Especifica se a etapa de produção usará o método "upload" ou "mount" ou "hdfs" para acessar os dados. Valor padrão: mount
|
path_on_compute
|
Para o modo "upload", o caminho no qual o módulo grava a saída. Valor padrão: None
|
is_directory
|
Se a saída é um diretório ou um único arquivo. Valor padrão: None
|
overwrite
|
Para o modo "upload", se deseja substituir os dados existentes. Valor padrão: None
|
data_type
|
Opcional. O tipo de dados pode ser usado para especificar o tipo da saída esperado e para detalhar como as etapas de consumo deverão usar os dados. Pode ser qualquer cadeia de caracteres definida pelo usuário. Valor padrão: None
|
pipeline_output_name
|
Se fornecida, essa saída estará disponível usando PipelineRun.get_pipeline_output(). Os nomes de saída do pipeline devem ser exclusivos no pipeline. Valor padrão: None
|
training_output
|
Define a saída do resultado do treinamento. É necessário apenas para treinamentos específicos que resultam em diferentes tipos de saídas, como Métricas e Modelo. Por exemplo, AutoMLStep resulta em métricas e modelo. Você também pode definir uma métrica ou iteração de treinamento específica usada para obter o melhor modelo. Para HyperDriveStep, você também pode definir os arquivos de modelo específicos a serem incluídos na saída. Valor padrão: None
|
dataset_registration
|
Opcional. Este é um parâmetro interno. Em vez disso, você deve usar PipelineData.as_dataset. Valor padrão: None
|
dataset_output
|
Opcional. Este é um parâmetro interno. Você deve usar OutputFileDatasetConfig em vez disso. Valor padrão: None
|
name
Obrigatório
|
Nome do objeto OutputPortBinding, que pode conter apenas letras, dígitos e sublinhados. |
datastore
Obrigatório
|
O Armazenamento de Dados no qual o PipelineData residirá. |
output_name
Obrigatório
|
Nome da saída, se o nome None for usado. Só pode conter letras, dígitos e sublinhados. |
bind_mode
Obrigatório
|
Especifica se a etapa de produção usará o método "upload" ou "mount" ou "hdfs" para acessar os dados. |
path_on_compute
Obrigatório
|
Para o modo "upload", o caminho no qual o módulo grava a saída. |
is_directory
Obrigatório
|
se a saída for um diretório |
overwrite
Obrigatório
|
Para o modo "upload", se deseja substituir os dados existentes. |
data_type
Obrigatório
|
Opcional. O tipo de dados pode ser usado para especificar o tipo da saída esperado e para detalhar como as etapas de consumo deverão usar os dados. Pode ser qualquer cadeia de caracteres definida pelo usuário. |
pipeline_output_name
Obrigatório
|
Se fornecida, essa saída estará disponível usando PipelineRun.get_pipeline_output(). Os nomes de saída do pipeline devem ser exclusivos no pipeline. |
training_output
Obrigatório
|
Define a saída do resultado do treinamento. É necessário apenas para treinamentos específicos que resultam em diferentes tipos de saídas, como Métricas e Modelo. Por exemplo, AutoMLStep resulta em métricas e modelo. Você também pode definir uma métrica ou iteração de treinamento específica usada para obter o melhor modelo. Para HyperDriveStep, você também pode definir os arquivos de modelo específicos a serem incluídos na saída. |
dataset_registration
Obrigatório
|
Opcional. Este é um parâmetro interno. Em vez disso, você deve usar PipelineData.as_dataset. |
dataset_output
Obrigatório
|
Opcional. Este é um parâmetro interno. Você deve usar OutputFileDatasetConfig em vez disso. |
Comentários
OutputPortBinding pode ser usado de maneira semelhante a PipelineData ao criar um Pipeline para especificar entradas e saídas de etapas. A diferença é que OutputPortBinding precisa ser usado com InputPortBinding para ser consumido como entrada para outra etapa.
Um exemplo para construir um Pipeline com OutputPortBinding é conforme a seguir:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Isso criará um Pipeline com duas etapas. A etapa do processo será executada primeiro e, depois de concluída, a etapa de treinamento será executada. O Azure ML fornecerá a saída produzida pela etapa do processo, conforme descrito pelo objeto OutputPortBinding, para a etapa de treinamento.
Atributos
bind_mode
Obtém o modo ("upload" ou "mount" ou "hdfs") que a etapa de produção usará para criar os dados.
Retornos
Tipo | Description |
---|---|
O modo de associação. |
data_type
dataset_registration
Obtém as informações de registro do conjunto de dados.
Retornos
Tipo | Description |
---|---|
As informações de registro do conjunto de dados. |
datastore
O Armazenamento de Dados no qual o PipelineData residirá.
Retornos
Tipo | Description |
---|---|
O objeto do armazenamento de dados. |
is_directory
name
overwrite
Para o modo "upload", indique se os dados existentes devem ser substituídos.
Retornos
Tipo | Description |
---|---|
_overwrite |
path_on_compute
Para o modo "upload", o caminho no qual o módulo grava a saída.
Retornos
Tipo | Description |
---|---|
path_on_compute |
pipeline_output_name
Obtém o nome da saída do pipeline correspondente a esse OutputPortBinding.
Retornos
Tipo | Description |
---|---|
O nome de saída do pipeline. |