TransformsCatalog.TextTransforms Classe
Definizione
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Classe usata da MLContext per creare istanze dei componenti di trasformazione dati di testo.
public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
- Ereditarietà
-
TransformsCatalog.TextTransforms
Metodi di estensione
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind) |
Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte un vettore di testo in un vettore numerico usando modelli di incorporamento pre-training. |
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String) |
Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte i vettori di testo in vettori numerici usando modelli di incorporamento pre-sottoposti a training. |
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[]) |
Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi. |
FeaturizeText(TransformsCatalog+TextTransforms, String, String) |
Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in un vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi. |
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean) |
Creare un LatentDirichletAllocationEstimatoroggetto , che usa LightLDA per trasformare il testo (rappresentato come vettore di float) in un vettore di Single che indica la somiglianza del testo con ogni argomento identificato. |
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean) |
Crea un TextNormalizingEstimatoroggetto , che normalizza il testo in |
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean) |
Creare un NgramHashingEstimatoroggetto , che copia i dati dalla colonna specificata in |
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean) |
Creare un NgramHashingEstimatoroggetto , che accetta i dati dalle più colonne specificate in |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Creare un WordHashBagEstimatoroggetto , che esegue il mapping della colonna specificata in |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Creare un WordHashBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in |
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Crea un oggetto NgramExtractingEstimator che produce un vettore di conteggi di n-grammi (sequenze di parole consecutive) rilevate nel testo di input. |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Creare un WordBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in a un vettore di conteggi n-gram in |
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language) |
Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in |
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[]) |
Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in |
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean) |
Creare un TokenizingByCharactersEstimatoroggetto , che tokenizza suddividendo il testo in sequenze di caratteri usando una finestra scorrevole. |
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[]) |
Creare un WordTokenizingEstimatoroggetto , che tokenzza il testo di input usando |