WordTokenizingEstimator Classe

Définition

Tokenise le texte d’entrée à l’aide de délimiteurs spécifiés.

public sealed class WordTokenizingEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.Text.WordTokenizingTransformer>
type WordTokenizingEstimator = class
    inherit TrivialEstimator<WordTokenizingTransformer>
Public NotInheritable Class WordTokenizingEstimator
Inherits TrivialEstimator(Of WordTokenizingTransformer)
Héritage

Remarques

Caractéristiques de l’estimateur

Ce estimateur doit-il examiner les données pour entraîner ses paramètres ? Non
Type de données de colonne d’entrée Scalaire ou vecteur de texte
Type de données de colonne de sortie Vecteur de taille variable du texte
Exportable vers ONNX Oui

Le résultat WordTokenizingTransformer crée une nouvelle colonne, nommée comme spécifié dans les paramètres de nom de colonne de sortie, où chaque chaîne d’entrée est mappée à un vecteur de sous-chaînes obtenue en fractionnant la chaîne d’entrée en fonction des délimiteurs définis par l’utilisateur. Le caractère d’espace est le délimiteur par défaut.

Les chaînes vides et les chaînes contenant uniquement des espaces sont supprimées.

Consultez la section Voir également pour obtenir des liens vers des exemples d’utilisation.

Méthodes

Fit(IDataView)

Tokenise le texte d’entrée à l’aide de délimiteurs spécifiés.

(Hérité de TrivialEstimator<TTransformer>)
GetOutputSchema(SchemaShape)

Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline.

Méthodes d’extension

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Étant donné un estimateur, retournez un objet de création de package de package qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important pour un estimateur de retourner des informations sur ce qui a été adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs via EstimatorChain<TLastTransformer> laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé.

S’applique à

Voir aussi