automl Pacote

Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning.

As áreas principais incluem a gestão de tarefas de AutoML.

Classes

ClassificationJob

Configuração da Tarefa de Classificação de AutoML.

Inicializar uma nova tarefa de Classificação de AutoML.

ColumnTransformer

Definições do transformador de colunas.

ForecastingJob

Configuração da Tarefa de Previsão de AutoML.

Inicializar uma nova tarefa de Previsão de AutoML.

ForecastingSettings

Definições de previsão para uma Tarefa de AutoML.

ImageClassificationJob

Configuração para tarefa de Classificação de Imagens de várias classes do AutoML.

Inicializar uma nova tarefa de Classificação de Imagens de várias classes de AutoML.

ImageClassificationMultilabelJob

Configuração para tarefa de Classificação de Imagens de várias etiquetas do AutoML.

Inicializar uma nova tarefa de Classificação de Imagens de multi-etiquetas autoML.

ImageClassificationSearchSpace

Espaço de pesquisa para tarefas De Classificação de Imagens de AutoML e Classificação de Imagens Multilabel.

ImageInstanceSegmentationJob

Configuração da tarefa de Segmentação de Instâncias de Imagem de AutoML.

Inicializar uma nova tarefa de Segmentação de Instâncias de Imagem de AutoML.

ImageLimitSettings

Limite as definições para Verticais de Imagem autoML.

ImageLimitSettings é uma classe que contém os seguintes parâmetros: max_concurrent_trials, max_trials e timeout_minutes.

Este é um método de configuração opcional para configurar parâmetros de limites, como tempos limite, etc.

Nota

O número de execuções simultâneas é controlado nos recursos disponíveis no destino de computação especificado.

Certifique-se de que o destino de computação tem os recursos disponíveis para a simultaneidade pretendida.

Dica

É uma boa prática corresponder max_concurrent_trials contagem com o número de nós no cluster.

Por exemplo, se tiver um cluster com 4 nós, defina max_concurrent_trials como 4.

Utilização de exemplo

Configuração de ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inicializar um objeto ImageLimitSettings.

Construtor para ImageLimitSettings para Verticais de Imagens de AutoML.

ImageModelSettingsClassification

Definições de modelo para tarefas de Classificação de Imagens de AutoML.

ImageModelSettingsObjectDetection

Definições de modelo para Tarefa de Deteção de Objetos de Imagem autoML.

ImageObjectDetectionJob

Configuração da tarefa de Deteção de Objetos de Imagem autoML.

Inicializar uma nova tarefa de Deteção de Objetos de Imagem autoML.

ImageObjectDetectionSearchSpace

Espaço de pesquisa para tarefas de Deteção de Objetos de Imagem AutoML e Segmentação de Instâncias de Imagem.

ImageSweepSettings

Definições de varrimento para todos os Verticais de Imagem autoML.

NlpFeaturizationSettings

Definições de caracterização para todos os Verticais NLP de AutoML.

NlpFixedParameters

Objeto para alojar parâmetros fixos para tarefas NLP.

NlpLimitSettings

Limite as definições para todos os Verticais NLP de AutoML.

NlpSearchSpace

Espaço de pesquisa para tarefas NLP de AutoML.

NlpSweepSettings

Definições de varrimento para todas as tarefas NLP de AutoML.

RegressionJob

Configuração da Tarefa de Regressão de AutoML.

Inicializar uma nova tarefa de Regressão de AutoML.

SearchSpace

Classe SearchSpace para verticais de AutoML.

StackEnsembleSettings

Definição avançada para personalizar a execução stackEnsemble.

TabularFeaturizationSettings

Definições de caracterização para uma Tarefa de AutoML.

TabularLimitSettings

Limitar as definições de uma Tabela AutoML Verticais.

TextClassificationJob

Configuração da Tarefa de Classificação de Textos de AutoML.

Inicializa uma nova tarefa de Classificação de Texto autoML.

TextClassificationMultilabelJob

Configuração da Tarefa Multilabela de Classificação de Textos de AutoML.

Inicializa uma nova tarefa Multilabel de Classificação de Texto autoML.

TextNerJob

Configuração para Tarefa de NER de Texto de AutoML.

Inicializa uma nova tarefa NER de Texto autoML.

TrainingSettings

TrainingSettings class for Azure Machine Learning (Classe TrainingSettings para o Azure Machine Learning).

TrainingSettings class for Azure Machine Learning (Classe TrainingSettings para o Azure Machine Learning).

Enumerações

BlockedTransformers

Enumeração para todos os modelos de classificação suportados pelo AutoML.

ClassificationModels

Enumeração para todos os modelos de classificação suportados pelo AutoML.

ClassificationMultilabelPrimaryMetrics

Métricas primárias para tarefas com várias etiquetas de classificação.

ClassificationPrimaryMetrics

Métricas primárias para tarefas de classificação.

FeaturizationMode

Modo de caracterização – determina o modo de caracterização de dados.

ForecastHorizonMode

Enumerar para determinar o modo de seleção de horizonte de previsão.

ForecastingModels

Enumeração para todos os modelos de previsão suportados pelo AutoML.

ForecastingPrimaryMetrics

Métricas primárias da tarefa Previsão.

InstanceSegmentationPrimaryMetrics

Métricas primárias para tarefas InstanceSegmentation.

LearningRateScheduler

Enumeração do agendador de taxa de aprendizagem.

LogTrainingMetrics

Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning.

As áreas principais incluem a gestão de tarefas de AutoML.

LogValidationLoss

Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning.

As áreas principais incluem a gestão de tarefas de AutoML.

NCrossValidationsMode

Determina a forma como o valor de validações N-Cross é determinado.

ObjectDetectionPrimaryMetrics

Métricas primárias da tarefa Image ObjectDetection.

RegressionModels

Enumeração para todos os modelos de Regressão suportados pelo AutoML.

RegressionPrimaryMetrics

Métricas primárias da tarefa regressão.

SamplingAlgorithmType

Contém aulas de machine learning automatizado para o SDKv2 do Azure Machine Learning.

As áreas principais incluem a gestão de tarefas de AutoML.

ShortSeriesHandlingConfiguration

O parâmetro que define como se o AutoML deve processar séries de tempo curtos.

StochasticOptimizer

Otimizador estocástico para modelos de imagem.

TargetAggregationFunction

Função de agregação de destino.

TargetLagsMode

O destino desfasa os modos de seleção.

TargetRollingWindowSizeMode

Modo de tamanho de janelas sem interrupção de destino.

UseStl

Configure a Decomposição de STL da coluna de destino da série temporal.

ValidationMetricType

Método de computação de métricas a utilizar para métricas de validação em tarefas de imagem.

Funções

classification

Função para criar um ClassificationJob.

Uma tarefa de classificação é utilizada para preparar um modelo que melhor prevê a classe de um exemplo de dados. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de etiqueta (opcionalmente, uma coluna de pesos de exemplo).

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável a training_dataparâmetros e validation_datatest_data

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Predefinições para precisão

enable_model_explainability
bool

Se pretende ativar a explicação do melhor modelo de AutoML no final de todas as iterações de preparação de AutoML. A predefinição é Nenhum. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos no machine learning automatizado).

weight_column_name
str

O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.

Este parâmetro é aplicável aos training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente, uma coluna de pesos de exemplo).

Predefinições para Nenhum

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a dobra de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas deve executar quando os dados de validação do utilizador não são especificados.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a pasta de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.

Predefinições para Nenhum

test_data
Input

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a utilizar para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Se este parâmetro ou o test_data_size parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo. Os dados de teste devem conter funcionalidades e colunas de etiqueta. Se test_data for especificado, o target_column_name parâmetro tem de ser especificado.

Predefinições para Nenhum

test_data_size
float

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Isto deve estar entre 0,0 e 1.0 não inclusivo. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste serão divididos antes de training_data os dados de validação serem divididos. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.

Para tarefas baseadas em regressão, é utilizada uma amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. A previsão não suporta atualmente a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.

Se este parâmetro ou o test_data parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.

Predefinições para Nenhum

Devoluções

Um objeto de tarefa que pode ser submetido a uma computação do Azure ML para execução.

Tipo de retorno

forecasting

Função para criar uma tarefa de Previsão.

Uma tarefa de previsão é utilizada para prever valores de destino para um período de tempo futuro com base nos dados históricos. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter as funcionalidades de preparação e uma coluna de etiqueta (opcionalmente uma coluna de pesos de exemplo).

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável a training_data, validation_data e test_data parâmetros

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Predefinições para normalized_root_mean_squared_error

enable_model_explainability
bool

Se pretende ativar a explicação do melhor modelo autoML no final de todas as iterações de preparação autoML. A predefinição é Nenhuma. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos na aprendizagem automática automatizada).

weight_column_name
str

O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.

Este parâmetro é aplicável a training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente uma coluna de pesos de exemplo).

Predefinições para Nenhum

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Isto deve estar entre 0,0 e 1.0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a pasta de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas deve executar quando os dados de validação do utilizador não são especificados.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a pasta de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.

Predefinições para Nenhum

test_data
Input

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a utilizar para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Se este parâmetro ou o test_data_size parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo. Os dados de teste devem conter funcionalidades e colunas de etiqueta. Se test_data for especificado, o target_column_name parâmetro tem de ser especificado.

Predefinições para Nenhum

test_data_size
float

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de teste obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Isto deve estar entre 0,0 e 1.0 não inclusivo. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste serão divididos antes de training_data os dados de validação serem divididos. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.

Para tarefas baseadas em regressão, é utilizada uma amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. A previsão não suporta atualmente a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.

Se este parâmetro ou o test_data parâmetro não forem especificados, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.

Predefinições para Nenhum

forecasting_settings
ForecastingSettings

As definições da tarefa de previsão

Devoluções

Um objeto de tarefa que pode ser submetido a uma computação do Azure ML para execução.

Tipo de retorno

image_classification

Cria um objeto para a tarefa de Classificação de várias classes da Imagem autoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação.

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável a training_data parâmetros e validation_data .

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted e precision_score_weighted Predefinições para precisão.

validation_data
Input

Os dados de validação a utilizar na experimentação.

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Isto deve estar entre 0,0 e 1.0 não inclusivo.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de preparação especificados.

Predefinições para .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

Objeto de tarefa de classificação de imagens que pode ser submetido para uma computação do Azure ML para execução.

Tipo de retorno

image_classification_multilabel

Cria um objeto para a tarefa de Classificação de várias etiquetas da Imagem autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação.

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável aos training_data parâmetros e validation_data .

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: precisão, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted e Predefinições Iou.

validation_data
Input

Os dados de validação a utilizar na experimentação.

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de preparação especificados.

Predefinições para .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

Imagem de objeto de tarefa de classificação de várias etiquetas que pode ser submetido a uma computação do Azure ML para execução.

Tipo de retorno

image_instance_segmentation

Cria um objeto para a tarefa de Segmentação de Instâncias de Imagem autoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação.

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável aos training_data parâmetros e validation_data .

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Os dados de validação a utilizar na experimentação.

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de preparação especificados.

Predefinições para .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

Tarefa de segmentação de instância de imagem

Tipo de retorno

image_object_detection

Cria um objeto para a tarefa de Deteção de Objetos de Imagem autoML.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação.

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável aos training_data parâmetros e validation_data .

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Os dados de validação a utilizar na experimentação.

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.

Especifique validation_data para fornecer dados de validação, caso contrário, defina validation_data_size para extrair dados de validação dos dados de preparação especificados.

Predefinições para .2

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

Objeto de tarefa de deteção de objetos de imagem que pode ser submetido para uma computação do Azure ML para execução.

Tipo de retorno

regression

Função para criar uma Tarefa de Regressão.

Uma tarefa de regressão é utilizada para preparar um modelo para prever valores contínuos de uma variável de destino a partir de um conjunto de dados. Vários modelos são preparados com os dados de preparação. O modelo com o melhor desempenho nos dados de validação com base na métrica primária é selecionado como o modelo final.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de etiqueta (opcionalmente, uma coluna de pesos de exemplo).

target_column_name
str

O nome da coluna de etiqueta. Este parâmetro é aplicável a training_dataparâmetros e validation_datatest_data

primary_metric

A métrica que o Machine Learning Automatizado irá otimizar para a seleção de modelos. O Machine Learning Automatizado recolhe mais métricas do que as que pode otimizar. Para obter mais informações sobre como as métricas são calculadas, consulte https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Valores aceitáveis: spearman_correlation, r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error. Predefinições para normalized_root_mean_squared_error

enable_model_explainability
bool

Se pretende ativar a explicação do melhor modelo de AutoML no final de todas as iterações de preparação de AutoML. A predefinição é Nenhum. Para obter mais informações, veja Interpretability: model explanations in automated machine learning (Interpretabilidade: explicações de modelos no machine learning automatizado).

weight_column_name
str

O nome da coluna de peso de exemplo. O ML automatizado suporta uma coluna ponderada como entrada, fazendo com que as linhas nos dados sejam ponderadas para cima ou para baixo. Se os dados de entrada forem de um pandas. DataFrame que não tem nomes de colunas, os índices de colunas podem ser utilizados, expressos como números inteiros.

Este parâmetro é aplicável aos training_data parâmetros e validation_data

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter as funcionalidades de preparação e a coluna de etiquetas (opcionalmente, uma coluna de pesos de exemplo).

Predefinições para Nenhum

validation_data_size
float

Que fração dos dados a reter para validação quando os dados de validação do utilizador não são especificados. Deve ser entre 0.0 e 1.0 não inclusive.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a dobra de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

n_cross_validations
Union[str, int]

Quantas validações cruzadas efetuar quando os dados de validação do utilizador não são especificados.

Especifique validation_data para fornecer dados de validação, caso contrário, defina n_cross_validations ou validation_data_size extraia dados de validação dos dados de preparação especificados. Para a dobra de validação cruzada personalizada, utilize cv_split_column_names.

Para obter mais informações, veja Configurar divisões de dados e validação cruzada no machine learning automatizado.

Predefinições para Nenhum

cv_split_column_names
List[str]

Lista de nomes das colunas que contêm a divisão de validação cruzada personalizada. Cada uma das colunas divididas por CV representa uma divisão cv em que cada linha está marcada como 1 para preparação ou 0 para validação.

Predefinições para Nenhum

test_data
Input

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Os dados de teste a serem utilizados para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de testes obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Se este parâmetro ou o test_data_size parâmetro não for especificado, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo. Os dados de teste devem conter funcionalidades e colunas de etiqueta. Se test_data for especificado, o target_column_name parâmetro tem de ser especificado.

Predefinições para Nenhum

test_data_size
float

A funcionalidade Teste de Modelo com conjuntos de dados de teste ou divisões de dados de teste é uma funcionalidade no estado de Pré-visualização e pode ser alterada em qualquer altura. Que fração dos dados de preparação a reter para dados de teste para uma execução de teste que será iniciada automaticamente após a conclusão da preparação do modelo. A execução de testes obterá predições com o melhor modelo e calculará as métricas dadas estas predições.

Deve ser entre 0.0 e 1.0 não inclusive. Se test_data_size for especificado ao mesmo tempo que validation_data_size, os dados de teste são divididos antes de os dados de training_data validação serem divididos. Por exemplo, se validation_data_size=0.1, test_data_size=0.1 e os dados de preparação originais tiverem 1000 linhas, os dados de teste terão 100 linhas, os dados de validação conterão 90 linhas e os dados de preparação terão 810 linhas.

Para tarefas baseadas em regressão, é utilizada a amostragem aleatória. Para tarefas de classificação, é utilizada a amostragem estratificada. Atualmente, a previsão não suporta a especificação de um conjunto de dados de teste com uma divisão de preparação/teste.

Se este parâmetro ou o test_data parâmetro não for especificado, nenhuma execução de teste será executada automaticamente após a conclusão da preparação do modelo.

Predefinições para Nenhum

Devoluções

Um objeto de tarefa que pode ser submetido para uma computação do Azure ML para execução.

Tipo de retorno

text_classification

Função para criar um TextClassificationJob.

Uma tarefa de classificação de textos é utilizada para preparar um modelo que possa prever a classe/categoria de dados de texto. Os dados de preparação de entrada devem incluir uma coluna de destino que classifica o texto em exatamente uma classe.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

target_column_name
str

Nome da coluna de destino.

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Métrica primária da tarefa. Valores aceitáveis: precisão, AUC_weighted, precision_score_weighted

log_verbosity
str

Nível de verbosidade do registo.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

O objeto TextClassificationJob.

Tipo de retorno

text_classification_multilabel

Função para criar um TextClassificationMultilabelJob.

Uma tarefa com várias etiquetas de classificação de textos é utilizada para preparar um modelo que possa prever as classes/categorias de dados de texto. Os dados de preparação de entrada devem incluir uma coluna de destino que classifica o texto na(es) classe(es). Para obter mais informações sobre o formato dos dados com várias etiquetas, veja: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

target_column_name
str

Nome da coluna de destino.

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

primary_metric
str

Métrica primária da tarefa. Valores aceitáveis: precisão

log_verbosity
str

Nível de verbosidade do registo.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

O objeto TextClassificationMultilabelJob.

Tipo de retorno

text_ner

Função para criar um TextNerJob.

Uma tarefa de reconhecimento de entidades denominada é utilizada para preparar um modelo que possa prever as entidades nomeadas no texto. Os dados de preparação de entrada devem ser um ficheiro de texto no formato CoNLL. Para obter mais informações sobre o formato dos dados NER de texto, veja: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parâmetros

training_data
Input

Os dados de preparação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

validation_data
Input

Os dados de validação a utilizar na experimentação. Deve conter funcionalidades de preparação e uma coluna de destino.

primary_metric
str

Métrica primária da tarefa. Valores aceitáveis: precisão

log_verbosity
str

Nível de verbosidade do registo.

kwargs
dict

Um dicionário de parâmetros de configuração adicionais.

Devoluções

O objeto TextNerJob.

Tipo de retorno