WordEmbeddingEstimator Classe

Définition

Text featurizer qui convertit les vecteurs de jetons de texte en vecteur numérique à l’aide d’un modèle d’incorporation préentraîné.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Héritage
WordEmbeddingEstimator
Implémente

Remarques

Caractéristiques de l’estimateur

Ce estimateur doit-il examiner les données pour entraîner ses paramètres ? Non
Type de données de colonne d’entrée Vecteur de texte
Type de données de colonne de sortie Vecteur de taille connue de Single
Exportable vers ONNX Non

Le WordEmbeddingTransformer produit une nouvelle colonne, nommée comme spécifié dans les paramètres de nom de colonne de sortie, où chaque vecteur d’entrée est mappé à un vecteur numérique avec une taille de 3 * dimensionnement du modèle incorporé utilisé. Notez que cela est indépendant de la taille du vecteur d’entrée.

Par exemple, lors de l’utilisation de GloVe50D, qui lui-même est de 50 dimensions, la colonne de sortie est un vecteur de taille 150. Le premier tiers des emplacements contient les valeurs minimales entre les incorporations correspondant à chaque chaîne du vecteur d’entrée. Le deuxième tiers contient la moyenne des incorporations. Le dernier tiers des emplacements contient les valeurs maximales des incorporations rencontrées. La valeur min/max fournit un hyper-rectangle englobant pour les mots de l’espace incorporé au mot. Cela peut aider à des expressions plus longues où la moyenne de nombreux mots noie le signal utile.

L’utilisateur peut spécifier un modèle d’incorporation préentraîné personnalisé ou l’un des modèles préentraînés disponibles. Les options disponibles sont différentes versions de GloVe Models, FastText et SSWE.

Consultez la section Voir également pour obtenir des liens vers des exemples d’utilisation.

Méthodes

Fit(IDataView)

Entraîne et retourne un WordEmbeddingTransformer.

GetOutputSchema(SchemaShape)

Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline.

Méthodes d’extension

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Étant donné un estimateur, retournez un objet de création de package de package qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important pour un estimateur de retourner des informations sur ce qui a été adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs via EstimatorChain<TLastTransformer> laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé.

S’applique à

Voir aussi