TextCatalog.ProduceWordBags Yöntem
Tanım
Önemli
Bazı bilgiler ürünün ön sürümüyle ilgilidir ve sürüm öncesinde önemli değişiklikler yapılmış olabilir. Burada verilen bilgilerle ilgili olarak Microsoft açık veya zımni hiçbir garanti vermez.
Aşırı Yüklemeler
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
WordBagEstimatoriçinde belirtilen sütunu, adlı |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
WordBagEstimatoriçinde belirtilen sütunu, adlı |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
WordBagEstimatoriçinde belirtilen birden çok sütunu, adlı |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnName
yeni bir sütundaki inputColumnName
n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parametreler
- catalog
- TransformsCatalog.TextTransforms
Dönüşümün kataloğu.
- outputColumnName
- String
dönüştürmesinden kaynaklanan sütunun inputColumnName
adı.
Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Verilerin alınacak sütunun adı. Sözlükte saklanacak n-gram sayısı üst sınırı.Terim/sıklık çiftlerini ayırmak için kullanılan ayırıcı.Terimleri sıklıklarından ayırmak için kullanılan ayırıcı. Bu tahmin aracı, metin vektörünün üzerinde çalışır.
- maximumNgramsCount
- Int32
Döndürülenler
Açıklamalar
WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .
Şunlara uygulanır
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
WordBagEstimatoriçinde belirtilen sütunu, adlı outputColumnName
yeni bir sütundaki inputColumnName
n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametreler
- catalog
- TransformsCatalog.TextTransforms
Dönüşümün kataloğu.
- outputColumnName
- String
dönüştürmesinden kaynaklanan sütunun inputColumnName
adı.
Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.
- inputColumnName
- String
Verilerin alınacak sütunun adı. Bu tahmin aracı, metin vektörünün üzerinde çalışır.
- ngramLength
- Int32
Ngram uzunluğu.
- skipLength
- Int32
N-gram oluştururken atlanması gereken belirteç sayısı üst sınırı.
- useAllLengths
- Boolean
en fazla ngramLength
veya yalnızca ngramLength
n gram uzunluklarının dahil edilip edilmeyeceği.
- maximumNgramsCount
- Int32
Sözlükte saklanacak n-gram sayısı üst sınırı.
Bir sözcüğün bir grup içindeki bir belge için ne kadar önemli olduğunu değerlendirmek için kullanılan istatistiksel ölçü.
Döndürülenler
Açıklamalar
WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .
Şunlara uygulanır
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
WordBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnName
yeni bir sütundaki inputColumnNames
n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parametreler
- catalog
- TransformsCatalog.TextTransforms
Dönüşümün kataloğu.
- outputColumnName
- String
dönüştürmesinden kaynaklanan sütunun inputColumnNames
adı.
Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.
- inputColumnNames
- String[]
Verilerin alınacak birden çok sütunun adları. Bu tahmin aracı, metin vektörünün üzerinde çalışır.
- ngramLength
- Int32
Ngram uzunluğu.
- skipLength
- Int32
N-gram oluştururken atlanması gereken belirteç sayısı üst sınırı.
- useAllLengths
- Boolean
en fazla ngramLength
veya yalnızca ngramLength
n gram uzunluklarının dahil edilip edilmeyeceği.
- maximumNgramsCount
- Int32
Sözlükte saklanacak n-gram sayısı üst sınırı.
Bir sözcüğün bir grup içindeki bir belge için ne kadar önemli olduğunu değerlendirmek için kullanılan istatistiksel ölçü.
Döndürülenler
Açıklamalar
WordBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi giriş olarak belirteçli metin aldığından farklıdır NgramExtractingEstimator .