ModelBatchDeploymentSettings Classe

Nota

Esta é uma classe experimental e pode mudar em qualquer altura. Para obter mais informações, veja https://aka.ms/azuremlexperimental.

Entidade Definições de Implementação do Batch do Modelo.

Herança
builtins.object
ModelBatchDeploymentSettings

Construtor

ModelBatchDeploymentSettings(*, mini_batch_size: int | None, instance_count: int | None = None, max_concurrency_per_instance: int | None = None, output_action: BatchDeploymentOutputAction | None = None, output_file_name: str | None = None, retry_settings: BatchRetrySettings | None = None, environment_variables: Dict[str, str] | None = None, error_threshold: int | None = None, logging_level: str | None = None, **kwargs: Any)

Parâmetros

Name Description
mini_batch_size
Necessário
int

Tamanho do mini-lote transmitido para cada invocação de lote, predefinição para 10

instance_count
Necessário
int

Número de instâncias em que a interferência será executada. Equivalente a resources.instance_count.

output_action
Necessário

Indica como a saída será organizada. Os valores possíveis incluem: "summary_only", "append_row". A predefinição é "append_row"

output_file_name
Necessário
str

O nome de ficheiro de saída personalizado para append_row ação de saída é predefinido como "predictions.csv"

max_concurrency_per_instance
Necessário
int

Indica o número máximo de paralelismo por instância, a predefinição é 1

retry_settings
Necessário

Definições de repetição para uma operação de inferência de lotes, predefinição para Nenhuma

environment_variables
Necessário

Variáveis de ambiente que serão definidas na implementação.

error_threshold
Necessário
int

Limiar de erro, se a contagem de erros de toda a entrada for superior a este valor, a inferência de lotes será abortada. O intervalo é [-1, int. MaxValue] -1 valor indica, ignore todas as falhas durante a inferência de lotes Para FileDataset contagem de falhas de ficheiros Para TabularDataset, esta é a contagem de falhas de registo, predefinições para -1

logging_level
Necessário
str

Nível de registo da operação de inferência de lotes, predefinido como "info"

Exemplos

Criar um objeto Definições de Implementação do Batch de Modelo.


   from azure.ai.ml.entities._deployment.model_batch_deployment_settings import ModelBatchDeploymentSettings

   modelBatchDeploymentSetting = ModelBatchDeploymentSettings(
       mini_batch_size=256,
       instance_count=5,
       max_concurrency_per_instance=2,
       output_file_name="output-file-name",
       environment_variables={"env1": "value1", "env2": "value2"},
       error_threshold=2,
       logging_level=1,
   )