TextCatalog.ProduceWordBags Yöntem

Tanım

Aşırı Yüklemeler

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnNames n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Parametreler

catalog
TransformsCatalog.TextTransforms

Dönüşümün kataloğu.

outputColumnName
String

dönüştürmesinden kaynaklanan sütunun inputColumnNameadı. Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Verilerin alınacak sütunun adı. Sözlükte saklanacak n-gram sayısı üst sınırı.Terim/sıklık çiftlerini ayırmak için kullanılan ayırıcı.Terimleri sıklıklarından ayırmak için kullanılan ayırıcı. Bu tahmin aracı, metin vektörünün üzerinde çalışır.

maximumNgramsCount
Int32

Döndürülenler

Açıklamalar

WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .

Şunlara uygulanır

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parametreler

catalog
TransformsCatalog.TextTransforms

Dönüşümün kataloğu.

outputColumnName
String

dönüştürmesinden kaynaklanan sütunun inputColumnNameadı. Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.

inputColumnName
String

Verilerin alınacak sütunun adı. Bu tahmin aracı, metin vektörünün üzerinde çalışır.

ngramLength
Int32

Ngram uzunluğu.

skipLength
Int32

N-gram oluştururken atlanması gereken belirteç sayısı üst sınırı.

useAllLengths
Boolean

en fazla ngramLength veya yalnızca ngramLengthn gram uzunluklarının dahil edilip edilmeyeceği.

maximumNgramsCount
Int32

Sözlükte saklanacak n-gram sayısı üst sınırı.

weighting
NgramExtractingEstimator.WeightingCriteria

Bir sözcüğün bir grup içindeki bir belge için ne kadar önemli olduğunu değerlendirmek için kullanılan istatistiksel ölçü.

Döndürülenler

Açıklamalar

WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .

Şunlara uygulanır

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnNames n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parametreler

catalog
TransformsCatalog.TextTransforms

Dönüşümün kataloğu.

outputColumnName
String

dönüştürmesinden kaynaklanan sütunun inputColumnNamesadı. Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.

inputColumnNames
String[]

Verilerin alınacak birden çok sütunun adları. Bu tahmin aracı, metin vektörünün üzerinde çalışır.

ngramLength
Int32

Ngram uzunluğu.

skipLength
Int32

N-gram oluştururken atlanması gereken belirteç sayısı üst sınırı.

useAllLengths
Boolean

en fazla ngramLength veya yalnızca ngramLengthn gram uzunluklarının dahil edilip edilmeyeceği.

maximumNgramsCount
Int32

Sözlükte saklanacak n-gram sayısı üst sınırı.

weighting
NgramExtractingEstimator.WeightingCriteria

Bir sözcüğün bir grup içindeki bir belge için ne kadar önemli olduğunu değerlendirmek için kullanılan istatistiksel ölçü.

Döndürülenler

Açıklamalar

WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .

Şunlara uygulanır