MutualInformationFeatureSelectingEstimator Sınıf

Tanım

Etiket sütunuyla (belirtilen sütunun değerini gözlemleyerek etiket hakkında öğrenebilecekleriniz) karşılıklı bilgilerine göre sıralanmış tüm belirtilen sütunlarda en üstteki k yuvalarını seçer.

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Devralma
MutualInformationFeatureSelectingEstimator
Uygulamalar

Açıklamalar

Tahmin Aracı Özellikleri

Bu tahmin aracının parametrelerini eğitmek için verilere bakması gerekiyor mu? Yes
Giriş sütunu veri türü Sayısal, metin veya anahtar veri türlerinin vektör veya skaler
Çıkış sütunu veri türü Giriş sütunuyla aynı
ONNX'e aktarılabilir Yes

Resmi olarak, karşılıklı bilgiler şöyle yazılabilir:

$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y))]$ burada $x$ ve $y$ $X$ ve $Y$ rastgele değişkenlerin gözlemleridir.

burada X ve Y'nin ortak dağılımında E beklentisi ele alınır. Burada P(x, y), X ve Y, P(x) ve P(y) eklem olasılık yoğunluğu işlevi sırasıyla X ve Y'nin marjinal olasılık yoğunluğu işlevleridir. Genel olarak, bağımlı değişken (veya etiket) ile bağımsız değişken (veya özellik) arasında daha yüksek bir karşılıklı bilgi, etiketin bu özellik üzerinde daha yüksek karşılıklı bağımlılığı olduğu anlamına gelir. Çıkış özelliklerindeki en üst yuvaları etiketle en büyük karşılıklı bilgilerle tutar.

Örneğin, aşağıdaki Özellikler ve Etiket sütunu için, etiket sütunuyla daha yüksek bağıntıya sahip ilk 2 yuvayı (vektör öğeleri) istediğimizi belirtirsek, bu Tahmin Aracı'nın uygulanması çıkışı yalnızca ilk ve üçüncü yuvaları tutar, çünkü değerleri Etiket sütunundaki değerlerle daha ilişkilidir.

Etiketle Özellikler
Doğru 4,6,0
Yanlış 0,7,5
Doğru 4,7,0
Yanlış 0,7,0

Tahmin aracını sığdırdıktan ve sonuçta elde edilen transformatörle verileri dönüştürdükten sonra yukarıdaki veri kümesi şöyle görünür:

Etiketle Özellikler
Doğru 4,0
Yanlış 0,5
Doğru 4,0
Yanlış 0,0

Kullanım örneklerinin bağlantıları için Ayrıca Bkz. bölümüne bakın.

Yöntemler

Fit(IDataView)

Bir ITransformereğiter ve döndürür.

GetOutputSchema(SchemaShape)

SchemaShape Transformatör tarafından üretilecek şemanın değerini döndürür. İşlem hattında şema yayma ve doğrulama için kullanılır.

Uzantı Metotları

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tahmin aracı zincirine bir 'önbelleğe alma denetim noktası' ekler. Bu, aşağı akış tahmincilerinin önbelleğe alınan verilere karşı eğitilmesini sağlar. Birden çok veri geçişi alan eğitmenlerden önce bir önbelleğe alma denetim noktası olması yararlıdır.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Tahmin aracı verildiğinde, çağrıldıktan sonra Fit(IDataView) temsilci çağıracak bir sarmalama nesnesi döndürün. Tahmin aracının neyin uygun olduğu hakkında bilgi döndürmesi genellikle önemlidir. Bu nedenle Fit(IDataView) yöntem yalnızca genel ITransformerbir nesne yerine özel olarak yazılan bir nesne döndürür. Bununla birlikte, aynı zamanda, IEstimator<TTransformer> genellikle birçok nesneye sahip işlem hatları halinde oluşturulur, bu nedenle transformatör almak istediğimiz tahmin aracının EstimatorChain<TLastTransformer> bu zincirde bir yere gömülü olduğu bir tahmin aracı zinciri oluşturmamız gerekebilir. Bu senaryo için, bu yöntem aracılığıyla sığdır çağrıldıktan sonra çağrılacak bir temsilci ekleyebiliriz.

Şunlara uygulanır

Ayrıca bkz.