ParallelComponent Classe
Versão paralela do componente, usada para definir um componente paralelo.
- Herança
-
azure.ai.ml.entities._component.component.ComponentParallelComponentazure.ai.ml.entities._job.parallel.parameterized_parallel.ParameterizedParallelParallelComponentazure.ai.ml.entities._component.code.ComponentCodeMixinParallelComponent
Construtor
ParallelComponent(*, name: str | None = None, version: str | None = None, description: str | None = None, tags: Dict[str, Any] | None = None, display_name: str | None = None, retry_settings: RetrySettings | None = None, logging_level: str | None = None, max_concurrency_per_instance: int | None = None, error_threshold: int | None = None, mini_batch_error_threshold: int | None = None, task: ParallelTask | None = None, mini_batch_size: str | None = None, partition_keys: List | None = None, input_data: str | None = None, resources: JobResourceConfiguration | None = None, inputs: Dict | None = None, outputs: Dict | None = None, code: str | None = None, instance_count: int | None = None, is_deterministic: bool = True, **kwargs: Any)
Parâmetros
Nome | Description |
---|---|
name
Obrigatório
|
Nome do componente. O padrão é Nenhum |
version
Obrigatório
|
A versão do componente. O padrão é Nenhum |
description
Obrigatório
|
Descrição do componente. O padrão é Nenhum |
tags
Obrigatório
|
Dicionário de marcas. As marcas podem ser adicionadas, removidas e atualizadas. O padrão é Nenhum |
display_name
Obrigatório
|
Nome de exibição do componente. O padrão é Nenhum |
retry_settings
Obrigatório
|
falha na repetição da execução do componente paralelo. O padrão é Nenhum |
logging_level
Obrigatório
|
Uma cadeia de caracteres do nome do nível de registro em log. O padrão é Nenhum |
max_concurrency_per_instance
Obrigatório
|
O paralelismo máximo que cada instância de computação tem. O padrão é Nenhum |
error_threshold
Obrigatório
|
O número de falhas de processamento de item deve ser ignorado. O padrão é Nenhum |
mini_batch_error_threshold
Obrigatório
|
O número de falhas de processamento de minilote deve ser ignorado. O padrão é Nenhum |
task
Obrigatório
|
A tarefa paralela. O padrão é Nenhum |
mini_batch_size
Obrigatório
|
Para entrada FileDataset, esse campo é o número de arquivos que um script do usuário pode processar em uma chamada run(). Para entrada TabularDataset, esse campo é o tamanho aproximado dos dados que o script do usuário pode processar em uma chamada run(). Os valores de exemplo são 1024, 1024 KB, 10 MB e 1 GB. (opcional, o valor padrão é 10 arquivos para FileDataset e 1MB para TabularDataset.) Esse valor pode ser definido por meio de PipelineParameter. |
partition_keys
Obrigatório
|
As chaves usadas para particionar o conjuntos de dados em minilotes. O padrão é Nenhum Se especificado, os dados com a mesma chave serão particionados no mesmo minilote. Se partition_keys e mini_batch_size forem especificados, partition_keys entrará em vigor. As entradas devem ser conjuntos de dados particionados e o partition_keys deve ser um subconjunto das chaves de cada conjunto de dados de entrada para que isso funcione. |
input_data
Obrigatório
|
Os dados de entrada. O padrão é Nenhum |
resources
Obrigatório
|
Configuração de recursos de computação para o componente. O padrão é Nenhum |
inputs
Obrigatório
|
Entradas do componente. O padrão é Nenhum |
outputs
Obrigatório
|
Saídas do componente. O padrão é Nenhum |
code
Obrigatório
|
propriedade promovida de task.code |
instance_count
Obrigatório
|
propriedade promovida de resources.instance_count. O padrão é Nenhum |
is_deterministic
Obrigatório
|
Se o componente paralelo é determinístico. O padrão é True |
Parâmetros de apenas palavra-chave
Nome | Description |
---|---|
name
Obrigatório
|
|
version
Obrigatório
|
|
description
Obrigatório
|
|
tags
Obrigatório
|
|
display_name
Obrigatório
|
|
retry_settings
Obrigatório
|
|
logging_level
Obrigatório
|
|
max_concurrency_per_instance
Obrigatório
|
|
error_threshold
Obrigatório
|
|
mini_batch_error_threshold
Obrigatório
|
|
task
Obrigatório
|
|
mini_batch_size
Obrigatório
|
|
partition_keys
Obrigatório
|
|
input_data
Obrigatório
|
|
resources
Obrigatório
|
|
inputs
Obrigatório
|
|
outputs
Obrigatório
|
|
code
Obrigatório
|
|
instance_count
Obrigatório
|
|
is_deterministic
|
valor padrão: True
|
Métodos
dump |
Despejar o conteúdo do componente em um arquivo no formato yaml. |
dump
Despejar o conteúdo do componente em um arquivo no formato yaml.
dump(dest: str | PathLike | IO, **kwargs: Any) -> None
Parâmetros
Nome | Description |
---|---|
dest
Obrigatório
|
O destino para receber o conteúdo desse componente. Deve ser um caminho para um arquivo local ou um fluxo de arquivos já aberto. Se dest for um caminho de arquivo, um novo arquivo será criado e uma exceção será gerada se o arquivo existir. Se dest for um arquivo aberto, o arquivo será gravado diretamente e uma exceção será gerada se o arquivo não for gravável. |
Atributos
base_path
code
Valor retornado de propriedade promovida task.code, que é um caminho local ou remoto que aponta para o código-fonte.
Retornos
Tipo | Description |
---|---|
Valor de task.code. |
creation_context
O contexto de criação do recurso.
Retornos
Tipo | Description |
---|---|
Os metadados de criação para o recurso. |
display_name
environment
O valor retornado de promoted property task.environment indica o ambiente no qual o trabalho de treinamento será executado.
Retornos
Tipo | Description |
---|---|
Valor de task.environment. |
id
A ID do recurso.
Retornos
Tipo | Description |
---|---|
A ID global do recurso, uma ID do ARM (Resource Manager do Azure). |
inputs
instance_count
Valor retornado da propriedade promovida resources.instance_count.
Retornos
Tipo | Description |
---|---|
Valor de resources.instance_count. |
is_deterministic
outputs
resources
retry_settings
task
type
version
Azure SDK for Python