TransformsCatalog.TextTransforms Classe

Definizione

Classe usata da MLContext per creare istanze dei componenti di trasformazione dati di testo.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Ereditarietà
TransformsCatalog.TextTransforms

Metodi di estensione

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte un vettore di testo in un vettore numerico usando modelli di incorporamento pre-training.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte i vettori di testo in vettori numerici usando modelli di incorporamento pre-sottoposti a training.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in un vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Creare un LatentDirichletAllocationEstimatoroggetto , che usa LightLDA per trasformare il testo (rappresentato come vettore di float) in un vettore di Single che indica la somiglianza del testo con ogni argomento identificato.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Crea un TextNormalizingEstimatoroggetto , che normalizza il testo in inputColumnName ingresso in, modificando facoltativamente maiuscole e minuscole, rimuovendo segni di punteggiatura, numeri e restituisce nuovo testo come outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Creare un NgramHashingEstimatoroggetto , che copia i dati dalla colonna specificata in inputColumnName una nuova colonna: outputColumnName e produce un vettore di conteggi di n-grammi hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Creare un NgramHashingEstimatoroggetto , che accetta i dati dalle più colonne specificate in inputColumnNames una nuova colonna: outputColumnName e produce un vettore di conteggi di n-grammi hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Creare un WordHashBagEstimatoroggetto , che esegue il mapping della colonna specificata in inputColumnName a un vettore di conteggi di n-grammi hash in una nuova colonna denominata outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Creare un WordHashBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in inputColumnNames a un vettore di conteggi di n-grammi hash in una nuova colonna denominata outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crea un oggetto NgramExtractingEstimator che produce un vettore di conteggi di n-grammi (sequenze di parole consecutive) rilevate nel testo di input.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in inputColumnName a un vettore di conteggi n-gram in una nuova colonna denominata outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in inputColumnName a un vettore di conteggi n-gram in una nuova colonna denominata outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Creare un WordBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in a un vettore di conteggi n-gram in inputColumnNames una nuova colonna denominata outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in inputColumnName in una nuova colonna: outputColumnName e rimuove un set di testo predefinito specifico per language esso.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in inputColumnName una nuova colonna: outputColumnName e rimuove il testo specificato da esso stopwords .

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Creare un TokenizingByCharactersEstimatoroggetto , che tokenizza suddividendo il testo in sequenze di caratteri usando una finestra scorrevole.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Creare un WordTokenizingEstimatoroggetto , che tokenzza il testo di input usando separators come separatori.

Si applica a