TextCatalog.ProduceWordBags Metodo
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Creare un WordBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in a un vettore di conteggi n-gram in |
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in inputColumnName
a un vettore di conteggi n-gram in una nuova colonna denominata outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parametri
- catalog
- TransformsCatalog.TextTransforms
Catalogo della trasformazione.
- outputColumnName
- String
Nome della colonna risultante dalla trasformazione di inputColumnName
.
Il tipo di dati di questa colonna sarà vettore di dimensioni note di Single.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Nome della colonna da cui eseguire i dati. Numero massimo di n grammi da archiviare nel dizionario.Separatore usato per separare le coppie termini/frequenza.Separatore usato per separare i termini dalla frequenza. Questo strumento di stima opera sul vettore di testo.
- maximumNgramsCount
- Int32
Restituisce
Commenti
WordBagEstimator è diverso da NgramExtractingEstimator in quanto il precedente tokenzza il testo internamente e quest'ultimo accetta testo tokenizzato come input.
Si applica a
ML.NET 3.0.0
Prodotto | Versioni |
---|---|
ML.NET | 3.0.0 |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in inputColumnName
a un vettore di conteggi n-gram in una nuova colonna denominata outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametri
- catalog
- TransformsCatalog.TextTransforms
Catalogo della trasformazione.
- outputColumnName
- String
Nome della colonna risultante dalla trasformazione di inputColumnName
.
Il tipo di dati di questa colonna sarà vettore di dimensioni note di Single.
- inputColumnName
- String
Nome della colonna da cui eseguire i dati. Questo strumento di stima opera sul vettore di testo.
- ngramLength
- Int32
Lunghezza Ngram.
- skipLength
- Int32
Numero massimo di token da ignorare quando si costruisce un n-gram.
- useAllLengths
- Boolean
Se includere tutte le lunghezze n-gram fino a ngramLength
o solo ngramLength
.
- maximumNgramsCount
- Int32
Numero massimo di n grammi da archiviare nel dizionario.
Misura statistica usata per valutare l'importanza di una parola in un documento in un corpus.
Restituisce
Commenti
WordBagEstimator è diverso da NgramExtractingEstimator in quanto il precedente tokenzza il testo internamente e quest'ultimo accetta testo tokenizzato come input.
Si applica a
ML.NET 3.0.0 e altre versioni
Prodotto | Versioni |
---|---|
ML.NET | 1.0.0, 1.1.0, 1.2.0, 1.3.1, 1.4.0, 1.5.0, 1.6.0, 1.7.0, 2.0.0, 3.0.0 |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Creare un WordBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in a un vettore di conteggi n-gram in inputColumnNames
una nuova colonna denominata outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametri
- catalog
- TransformsCatalog.TextTransforms
Catalogo della trasformazione.
- outputColumnName
- String
Nome della colonna risultante dalla trasformazione di inputColumnNames
.
Il tipo di dati di questa colonna sarà vettore di dimensioni note di Single.
- inputColumnNames
- String[]
Nomi delle più colonne da cui eseguire i dati. Questo strumento di stima opera sul vettore di testo.
- ngramLength
- Int32
Lunghezza Ngram.
- skipLength
- Int32
Numero massimo di token da ignorare quando si costruisce un n-gram.
- useAllLengths
- Boolean
Se includere tutte le lunghezze n-gram fino a ngramLength
o solo ngramLength
.
- maximumNgramsCount
- Int32
Numero massimo di n grammi da archiviare nel dizionario.
Misura statistica usata per valutare l'importanza di una parola in un documento in un corpus.
Restituisce
Commenti
WordBagEstimator è diverso da NgramExtractingEstimator in quanto il precedente tokenzza il testo internamente e quest'ultimo accetta testo tokenizzato come input.
Si applica a
ML.NET 3.0.0 e altre versioni
Prodotto | Versioni |
---|---|
ML.NET | 1.0.0, 1.1.0, 1.2.0, 1.3.1, 1.4.0, 1.5.0, 1.6.0, 1.7.0, 2.0.0, 3.0.0 |