TextClassificationJob Classe

Configuration du travail de classification de texte AutoML.

Initialise une nouvelle tâche de classification de texte AutoML.

Héritage
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

Constructeur

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Paramètres

target_column_name
Obligatoire

Nom de la colonne cible

training_data
Obligatoire

Données d’entraînement à utiliser pour l’entraînement

validation_data
Obligatoire

Données de validation à utiliser pour évaluer le modèle entraîné

primary_metric
Obligatoire

Métrique principale à afficher

log_verbosity
Obligatoire

Niveau de détail du journal

kwargs
Obligatoire

Arguments spécifiques au travail

Méthodes

dump

Vide le contenu du travail dans un fichier au format YAML.

extend_search_space

Ajoutez (a) espace(s) de recherche pour ce travail NLP AutoML.

set_data
set_featurization
set_limits
set_sweep

Paramètres de balayage pour toutes les tâches NLP AutoML.

set_training_parameters

Corrigez certains paramètres d’entraînement tout au long de la procédure d’entraînement pour tous les candidats.

Passer. Il doit s’agir d’un entier positif. :mot clé learning_rate : taux d’apprentissage initial. Doit être un float dans (0, 1). :mot clé learning_rate_scheduler : type de planificateur de taux d’apprentissage. Vous devez choisir entre « linear », « cosinus », « cosine_with_restarts », « polynomial », « constant » et « constant_with_warmup ». :mot clé model_name : nom du modèle à utiliser pendant l’entraînement. Doit choisir parmi 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' et 'xlnet-large-cased'. :mot clé number_of_epochs : nombre d’époques avec 2. Cette valeur doit être un entier positif. :mot clé training_batch_size : taille du lot pendant l’entraînement. Cette valeur doit être un entier positif. :mot clé validation_batch_size : taille du lot pendant la validation. Cette valeur doit être un entier positif. :mot clé warmup_ratio : ratio des étapes d’entraînement totales utilisées pour un échauffement linéaire de 0 à learning_rate. Doit être un float dans [0, 1]. :mot clé weight_decay : valeur de la dégradation du poids lorsque l’optimiseur est sgd, adam ou adamw. Il doit s’agir d’un float dans la plage [0, 1]. :return : Aucun.

dump

Vide le contenu du travail dans un fichier au format YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Paramètres

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Obligatoire

Chemin d’accès local ou flux de fichiers dans lequel écrire le contenu YAML. Si dest est un chemin de fichier, un nouveau fichier est créé. Si dest est un fichier ouvert, le fichier est écrit directement dans.

kwargs
dict

Arguments supplémentaires à passer au sérialiseur YAML.

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

extend_search_space

Ajoutez (a) espace(s) de recherche pour ce travail NLP AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Paramètres

value
Union[SearchSpace, List[SearchSpace]]
Obligatoire

un objet SearchSpace ou une liste d’objets SearchSpace avec des paramètres spécifiques à nlp.

Retours

Aucun.

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

set_sweep

Paramètres de balayage pour toutes les tâches NLP AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Paramètres

sampling_algorithm

Obligatoire. Spécifie le type d’algorithme d’échantillonnage des hyperparamètres. Les valeurs possibles incluent : « Grid », « Random » et « Bayésian ».

early_termination

Politique de résiliation anticipée facultative pour mettre fin à la formation des candidats peu performants.

Retours

None

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

set_training_parameters

Corrigez certains paramètres d’entraînement tout au long de la procédure d’entraînement pour tous les candidats.

Passer. Il doit s’agir d’un entier positif. :mot clé learning_rate : taux d’apprentissage initial. Doit être un float dans (0, 1). :mot clé learning_rate_scheduler : type de planificateur de taux d’apprentissage. Vous devez choisir entre « linear », « cosinus », « cosine_with_restarts », « polynomial », « constant » et « constant_with_warmup ». :mot clé model_name : nom du modèle à utiliser pendant l’entraînement. Doit choisir parmi 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' et 'xlnet-large-cased'. :mot clé number_of_epochs : nombre d’époques avec 2. Cette valeur doit être un entier positif. :mot clé training_batch_size : taille du lot pendant l’entraînement. Cette valeur doit être un entier positif. :mot clé validation_batch_size : taille du lot pendant la validation. Cette valeur doit être un entier positif. :mot clé warmup_ratio : ratio des étapes d’entraînement totales utilisées pour un échauffement linéaire de 0 à learning_rate. Doit être un float dans [0, 1]. :mot clé weight_decay : valeur de la dégradation du poids lorsque l’optimiseur est sgd, adam ou adamw. Il doit s’agir d’un float dans la plage [0, 1]. :return : Aucun.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Paramètres

gradient_accumulation_steps

nombre d’étapes sur lesquelles accumuler des dégradés avant une marche arrière

Exceptions

Déclenché si dest est un chemin de fichier et que le fichier existe déjà.

Déclenché si dest est un fichier ouvert et que le fichier n’est pas accessible en écriture.

Attributs

base_path

Chemin d’accès de base de la ressource.

Retours

Chemin d’accès de base de la ressource.

Type de retour

str

creation_context

Contexte de création de la ressource.

Retours

Métadonnées de création pour la ressource.

Type de retour

featurization

id

ID de la ressource.

Retours

ID global de la ressource, id Azure Resource Manager (ARM).

Type de retour

inputs

limits

log_files

Fichiers de sortie de travail.

Retours

Dictionnaire des noms de journaux et des URL.

Type de retour

log_verbosity

outputs

primary_metric

search_space

status

État du travail.

Les valeurs courantes retournées sont « Exécution en cours (Running) », « Terminé (Finished) » et « Échec (Failed) ». Toutes les valeurs possibles sont les suivantes :

  • NotStarted : il s’agit d’un état temporaire dans lequel se trouvent les objets Run côté client avant la soumission cloud.

  • Démarrage : l’exécution a commencé à être traitée dans le cloud. L’appelant a un ID d’exécution à ce stade.

  • Approvisionnement : le calcul à la demande est en cours de création pour une soumission de travail donnée.

  • Préparation : l’environnement d’exécution est en cours de préparation et se trouve dans l’une des deux étapes suivantes :

    • Build d’image Docker

    • Configuration de l’environnement Conda

  • Mis en file d’attente : le travail est mis en file d’attente sur la cible de calcul. Par exemple, dans BatchAI, le travail est dans un état mis en file d’attente

    en attendant que tous les nœuds demandés soient prêts.

  • En cours d’exécution : le travail a commencé à s’exécuter sur la cible de calcul.

  • Finalisation : l’exécution du code utilisateur est terminée et l’exécution est en phase de post-traitement.

  • CancelRequested : l’annulation a été demandée pour le travail.

  • Terminé : l’exécution s’est terminée avec succès. Cela inclut à la fois l’exécution et l’exécution du code utilisateur

    Étapes de post-traitement.

  • Failed (Échec) : l’exécution a échoué. En règle générale, la propriété Error d’une exécution fournit des détails sur la raison de l’échec.

  • Annulé : suit une demande d’annulation et indique que l’exécution a bien été annulée.

  • NotResponding : pour les exécutions pour lesquelles des pulsations sont activées, aucune pulsation n’a été envoyée récemment.

Retours

État du travail.

Type de retour

studio_url

Point de terminaison Azure ML Studio.

Retours

URL de la page des détails du travail.

Type de retour

sweep

task_type

Obtenir le type de tâche.

Retours

Type de tâche à exécuter. Les valeurs possibles sont les suivantes : « classification », « régression », « forecasting ».

Type de retour

str

test_data

Obtenir des données de test.

Retours

Entrée de données de test

Type de retour

training_data

Obtenir des données d’entraînement.

Retours

Entrée de données d’entraînement

Type de retour

training_parameters

type

Type du travail.

Retours

Type du travail.

Type de retour

validation_data

Obtenir des données de validation.

Retours

Entrée de données de validation

Type de retour