OutputPortBinding Clase

Define una salida con nombre de un paso de canalización.

OutputPortBinding se puede usar para especificar el tipo de datos que se producirá mediante un paso y cómo se producirán los datos. Se puede usar con InputPortBinding para especificar que la salida del paso sea una entrada necesaria de otro paso.

Inicialice OutputPortBinding.

Herencia
builtins.object
OutputPortBinding

Constructor

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parámetros

Nombre Description
name
Requerido
str

Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.

datastore

Almacén de datos en el que residirá PipelineData.

Valor predeterminado: None
output_name
str

Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.

Valor predeterminado: None
bind_mode
str

Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.

Valor predeterminado: mount
path_on_compute
str

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

Valor predeterminado: None
is_directory

Si la salida es un directorio o un único archivo.

Valor predeterminado: None
overwrite

Para el modo "upload", si se van a sobrescribir los datos existentes.

Valor predeterminado: None
data_type
str

Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.

Valor predeterminado: None
pipeline_output_name
str

Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.

Valor predeterminado: None
training_output

Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.

Valor predeterminado: None
dataset_registration

Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.

Valor predeterminado: None
dataset_output

Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.

Valor predeterminado: None
name
Requerido
str

Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.

datastore
Requerido

Almacén de datos en el que residirá PipelineData.

output_name
Requerido
str

Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.

bind_mode
Requerido
str

Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.

path_on_compute
Requerido
str

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

is_directory
Requerido

si la salida es un directorio

overwrite
Requerido

Para el modo "upload", si se van a sobrescribir los datos existentes.

data_type
Requerido
str

Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.

pipeline_output_name
Requerido
str

Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.

training_output
Requerido

Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.

dataset_registration
Requerido

Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.

dataset_output
Requerido

Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.

Comentarios

OutputPortBinding se puede usar de forma similar a PipelineData cuando se compila una canalización para especificar entradas y salidas de pasos. La diferencia es que OutputPortBinding debe usarse con InputPortBinding para poder consumirse como entrada en otro paso.

A continuación se muestra un ejemplo para construir una canalización con OutputPortBinding:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Esto creará una canalización con dos pasos. El paso de proceso se ejecutará primero y, después de que se haya completado, se ejecutará el paso de aprendizaje. Azure ML proporcionará la salida producida por el paso de proceso, como se describe en el objeto OutputPortBinding, al paso de aprendizaje.

Atributos

bind_mode

Obtenga el modo ("upload", "mount" o "hdfs") que usará el paso de producción para crear los datos.

Devoluciones

Tipo Description
str

Modo de enlace.

data_type

Obtenga el tipo de datos que se producirá.

Devoluciones

Tipo Description
str

El nombre del tipo de datos.

dataset_registration

Obtenga la información de registro del conjunto de datos.

Devoluciones

Tipo Description

La información de registro del conjunto de datos.

datastore

Almacén de datos en el que residirá PipelineData.

Devoluciones

Tipo Description

El objeto del almacén de datos.

is_directory

Si la salida es un directorio.

Devoluciones

Tipo Description

is_directory

name

Nombre del objeto OutputPortBinding.

Devoluciones

Tipo Description
str

Nombre.

overwrite

Para el modo "upload", indique si desea sobrescribir los datos existentes.

Devoluciones

Tipo Description

_overwrite

path_on_compute

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

Devoluciones

Tipo Description
str

path_on_compute

pipeline_output_name

Obtenga el nombre de la salida de canalización correspondiente a este OutputPortBinding.

Devoluciones

Tipo Description
str

Nombre de salida de la canalización.

training_output

Obtenga la salida de entrenamiento.

Devoluciones

Tipo Description

Salida de aprendizaje