ClusteringCatalog.CrossValidate Yöntem

Tanım

, katları estimatordataüzerinde numberOfFolds çapraz doğrulamayı çalıştırmak için , ve bağlantı sağlandıysa bunu dikkate alarak samplingKeyColumnName çalıştırın. Ardından her alt modeli karşı labelColumnName değerlendirin ve ölçümleri döndürin.

public System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>> CrossValidate (Microsoft.ML.IDataView data, Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> estimator, int numberOfFolds = 5, string labelColumnName = default, string featuresColumnName = default, string samplingKeyColumnName = default, int? seed = default);
member this.CrossValidate : Microsoft.ML.IDataView * Microsoft.ML.IEstimator<Microsoft.ML.ITransformer> * int * string * string * string * Nullable<int> -> System.Collections.Generic.IReadOnlyList<Microsoft.ML.TrainCatalogBase.CrossValidationResult<Microsoft.ML.Data.ClusteringMetrics>>
Public Function CrossValidate (data As IDataView, estimator As IEstimator(Of ITransformer), Optional numberOfFolds As Integer = 5, Optional labelColumnName As String = Nothing, Optional featuresColumnName As String = Nothing, Optional samplingKeyColumnName As String = Nothing, Optional seed As Nullable(Of Integer) = Nothing) As IReadOnlyList(Of TrainCatalogBase.CrossValidationResult(Of ClusteringMetrics))

Parametreler

data
IDataView

Çapraz doğrulamanın çalıştırılacak veriler.

estimator
IEstimator<ITransformer>

Uygun tahmin aracı.

numberOfFolds
Int32

Çapraz doğrulama katlama sayısı.

labelColumnName
String

Değerlendirme için isteğe bağlı etiket sütunu (kümeleme görevlerinin her zaman bir etiketi olmayabilir).

featuresColumnName
String

Değerlendirme için isteğe bağlı özellikler sütunu (Dbi ölçümünü hesaplamak için gereklidir)

samplingKeyColumnName
String

Satırları gruplandırmak için kullanılacak sütunun adı. İki örnek aynı değerini samplingKeyColumnNamepaylaşıyorsa, bunların aynı alt kümede (eğitim veya test) görüneceği garanti edilir. Bu, trenden test kümesine etiket sızıntısı olmamasını sağlamak için kullanılabilir. Satır gruplandırma gerçekleştirilmeyecekse null .

seed
Nullable<Int32>

Çapraz doğrulama katlamaları için satırları seçmek için kullanılan rastgele sayı oluşturucunun tohumu.

Döndürülenler

Şunlara uygulanır