TextCatalog.ProduceHashedWordBags Yöntem

Tanım

Aşırı Yüklemeler

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütunda inputColumnNames karma n gram sayısı vektörleriyle eşleyen bir oluşturun.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütunda inputColumnName karma n gram sayılarının bulunduğu bir vektörle eşleyen bir oluşturun.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütunda inputColumnNames karma n gram sayısı vektörleriyle eşleyen bir oluşturun.

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

Parametreler

catalog
TransformsCatalog.TextTransforms

Dönüşümün kataloğu.

outputColumnName
String

dönüştürmesinden kaynaklanan sütunun inputColumnNamesadı. Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.

inputColumnNames
String[]

Verileri almak için birden çok sütunun adları. Bu tahmin aracı, metin vektörünün üzerinde çalışır.

numberOfBits
Int32

Karma değere dönüştürülecek bit sayısı. 1 ile 30 (dahil) arasında olmalıdır.

ngramLength
Int32

Ngram uzunluğu.

skipLength
Int32

N-gram oluştururken atlanması gereken en fazla belirteç sayısı.

useAllLengths
Boolean

En fazla ngramLength veya yalnızca ngramLengthn-gram uzunluklarının dahil edilip edilmeyeceği.

seed
UInt32

Karma tohum.

useOrderedHashing
Boolean

Her kaynak sütunun konumunun karmaya eklenip eklenmeyeceği (birden çok kaynak sütun olduğunda).

maximumNumberOfInverts
Int32

Karma oluşturma sırasında özgün değerler ve üretilen karma değerler arasında eşlemeler oluştururuz. Özgün değerlerin metin gösterimi, yeni sütunun ek açıklamalarının yuva adlarında depolanır. Bu şekilde karma oluşturma, birçok başlangıç değerini bir değerle eşleyebilir. maximumNumberOfInverts , saklanması gereken bir karmayla eşlenen benzersiz giriş değerlerinin sayısının üst sınırlarını belirtir. 0 hiçbir giriş değerini korumaz. -1 , her karmayla eşlem yapılan tüm giriş değerlerini korur.

Döndürülenler

Açıklamalar

WordHashBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi de belirteçli metni giriş olarak aldığından farklıdır NgramHashingEstimator .

Şunlara uygulanır

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütunda inputColumnName karma n gram sayılarının bulunduğu bir vektörle eşleyen bir oluşturun.

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

Parametreler

catalog
TransformsCatalog.TextTransforms

Dönüşümün kataloğu.

outputColumnName
String

dönüştürmesinden kaynaklanan sütunun inputColumnNameadı. Bu sütunun veri türü bilinen boyutta vektör Singleolacaktır.

inputColumnName
String

Verilerin alınacak sütunun adı. Bu tahmin aracı, metin vektörünün üzerinde çalışır.

numberOfBits
Int32

Karma değere dönüştürülecek bit sayısı. 1 ile 30 (dahil) arasında olmalıdır.

ngramLength
Int32

Ngram uzunluğu.

skipLength
Int32

N-gram oluştururken atlanması gereken en fazla belirteç sayısı.

useAllLengths
Boolean

En fazla ngramLength veya yalnızca ngramLengthn-gram uzunluklarının dahil edilip edilmeyeceği.

seed
UInt32

Karma tohum.

useOrderedHashing
Boolean

Her kaynak sütunun konumunun karmaya eklenip eklenmeyeceği (birden çok kaynak sütun olduğunda).

maximumNumberOfInverts
Int32

Karma oluşturma sırasında özgün değerler ve üretilen karma değerler arasında eşlemeler oluştururuz. Özgün değerlerin metin gösterimi, yeni sütunun ek açıklamalarının yuva adlarında depolanır. Bu şekilde karma oluşturma, birçok başlangıç değerini bir değerle eşleyebilir. maximumNumberOfInverts , saklanması gereken bir karmayla eşlenen benzersiz giriş değerlerinin sayısının üst sınırlarını belirtir. 0 hiçbir giriş değerini korumaz. -1 , her karmayla eşlem yapılan tüm giriş değerlerini korur.

Döndürülenler

Açıklamalar

WordHashBagEstimator , öncekinin metni dahili olarak belirteç haline getirdiğinden ve ikincisi de belirteçli metni giriş olarak aldığından farklıdır NgramHashingEstimator .

Şunlara uygulanır