TextClassificationJob Класс
Настройка задания классификации текста AutoML.
Инициализирует новую задачу классификации текста AutoML.
- Наследование
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationJob
Конструктор
TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)
Параметры
- target_column_name
Имя целевого столбца
- training_data
Обучающие данные, используемые для обучения
- validation_data
Данные проверки, используемые для оценки обученной модели
- primary_metric
Основная отображаемая метрика
- log_verbosity
Уровень детализации журнала
- kwargs
Аргументы, относящиеся к заданию
Методы
dump |
Помещает содержимое задания в файл в формате YAML. |
extend_search_space |
Добавьте (a) пространства поиска для этого задания NLP AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Параметры очистки для всех задач NLP AutoML. |
set_training_parameters |
Исправьте определенные параметры обучения на протяжении всей процедуры обучения для всех кандидатов. Пройти. Это должно быть положительное целое число. :ключевое слово learning_rate: начальная скорость обучения. Должен быть с плавающей точкой в (0, 1). :ключевое слово learning_rate_scheduler: тип планировщика скорости обучения. Необходимо выбрать варианты "linear", "cosine", "cosine_with_restarts", "polynomial", "constant" и "constant_with_warmup". :ключевое слово model_name: имя модели, используемое во время обучения. Необходимо выбрать из "bert-base-cased", "bert-base-uncased", "bert-base-многоязычный регистр", "bert-base-german-cased", "bert-large-cased", 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased и 'xlnet-large-cased'. :ключевое слово number_of_epochs: количество эпох для обучения. Принимаются только положительные целые числа. :ключевое слово training_batch_size: размер пакета во время обучения. Принимаются только положительные целые числа. :ключевое слово validation_batch_size: размер пакета во время проверки. Принимаются только положительные целые числа. :ключевое слово warmup_ratio: соотношение общего числа шагов обучения, используемых для линейной прогрева, от 0 к learning_rate. Должен быть плавающей точкой в [0, 1]. :ключевое слово weight_decay: значение ослабления веса, если оптимизатор имеет значение sgd, adam или adamw. Это должно быть число с плавающей точкой в диапазоне [0, 1]. :return: нет. |
dump
Помещает содержимое задания в файл в формате YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Параметры
Локальный путь или файловый поток для записи содержимого YAML. Если dest — это путь к файлу, будет создан новый файл. Если dest является открытым файлом, файл будет записан в напрямую.
- kwargs
- dict
Дополнительные аргументы для передачи сериализатору YAML.
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
extend_search_space
Добавьте (a) пространства поиска для этого задания NLP AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Параметры
- value
- Union[SearchSpace, List[SearchSpace]]
объект SearchSpace или список объектов SearchSpace с параметрами, зависящими от nlp.
Возвращаемое значение
Нет.
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
set_sweep
Параметры очистки для всех задач NLP AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Параметры
- sampling_algorithm
Обязательный. Указывает тип алгоритма выборки гиперпараметров. Возможные значения: "Grid", "Random" и "Bayesian".
- early_termination
Необязательная политика досрочного завершения, чтобы положить конец плохой производительности кандидатов на обучение.
Возвращаемое значение
Нет
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
set_training_parameters
Исправьте определенные параметры обучения на протяжении всей процедуры обучения для всех кандидатов.
Пройти. Это должно быть положительное целое число. :ключевое слово learning_rate: начальная скорость обучения. Должен быть с плавающей точкой в (0, 1). :ключевое слово learning_rate_scheduler: тип планировщика скорости обучения. Необходимо выбрать варианты "linear", "cosine", "cosine_with_restarts", "polynomial", "constant" и "constant_with_warmup". :ключевое слово model_name: имя модели, используемое во время обучения. Необходимо выбрать из "bert-base-cased", "bert-base-uncased", "bert-base-многоязычный регистр", "bert-base-german-cased", "bert-large-cased", 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased и 'xlnet-large-cased'. :ключевое слово number_of_epochs: количество эпох для обучения. Принимаются только положительные целые числа. :ключевое слово training_batch_size: размер пакета во время обучения. Принимаются только положительные целые числа. :ключевое слово validation_batch_size: размер пакета во время проверки. Принимаются только положительные целые числа. :ключевое слово warmup_ratio: соотношение общего числа шагов обучения, используемых для линейной прогрева, от 0 к learning_rate. Должен быть плавающей точкой в [0, 1]. :ключевое слово weight_decay: значение ослабления веса, если оптимизатор имеет значение sgd, adam или adamw. Это должно быть число с плавающей точкой в диапазоне [0, 1]. :return: нет.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Параметры
- gradient_accumulation_steps
количество шагов, по которым накапливаются градиенты перед обратным
Исключения
Возникает, если dest является путем к файлу и файл уже существует.
Возникает, если dest является открытым файлом и файл недоступен для записи.
Атрибуты
base_path
creation_context
Контекст создания ресурса.
Возвращаемое значение
Метаданные создания для ресурса.
Возвращаемый тип
featurization
id
Идентификатор ресурса.
Возвращаемое значение
Глобальный идентификатор ресурса, идентификатор Azure Resource Manager (ARM).
Возвращаемый тип
inputs
limits
log_files
Выходные файлы задания.
Возвращаемое значение
Словарь имен журналов и URL-адресов.
Возвращаемый тип
log_verbosity
outputs
primary_metric
search_space
status
Состояние задания.
Обычно возвращаются значения Running (Выполняется), Completed (Завершено) и Failed (Сбой). Все возможные значения:
NotStarted — это временное состояние, в которое находятся клиентские объекты run до отправки в облако.
Starting — началась обработка запуска в облаке. На этом этапе вызывающий объект имеет идентификатор запуска.
Подготовка. Для отправки задания создается вычисление по запросу.
Подготовка — среда выполнения подготавливается и находится в одном из двух этапов:
Сборка образа Docker
настройка среды conda.
В очереди — задание помещается в очередь в целевом объекте вычислений. Например, в BatchAI задание находится в состоянии очереди.
ожидая готовности всех запрошенных узлов.
Выполнение — задание началось для выполнения в целевом объекте вычислений.
Завершение — выполнение пользовательского кода завершено, а выполнение выполняется в этапах постобработки.
CancelRequested — для задания запрошена отмена.
Завершено — выполнение выполнено успешно. Сюда входит выполнение пользовательского кода и выполнение.
пользовательского кода и запуска.
Failed — сбой запуска. Подробное описание причины как правило предоставляет свойство Error.
Canceled — применяется после запроса отмены и указывает, что выполнение теперь успешно отменено.
NotResponding — для запусков с включенными пульсами недавно не отправлялся пульс.
Возвращаемое значение
Состояние задания.
Возвращаемый тип
studio_url
Конечная точка Студии машинного обучения Azure.
Возвращаемое значение
URL-адрес страницы сведений о задании.
Возвращаемый тип
sweep
task_type
Получение типа задачи.
Возвращаемое значение
Тип выполняемой задачи. Возможные значения: "классификация", "регрессия", "прогнозирование".
Возвращаемый тип
test_data
training_data
Получение обучающих данных.
Возвращаемое значение
Входные данные для обучения
Возвращаемый тип
training_parameters
type
validation_data
Azure SDK for Python