Özellik önem derecelerini değerlendirme
Önemli
20 Eylül 2023 tarihinden itibaren yeni Kişiselleştirme kaynakları oluşturamayacaksınız. Kişiselleştirme hizmeti 1 Ekim 2026'da kullanımdan kaldırılıyor.
Geçmiş günlük verilerinizde bir özellik değerlendirmesi yaparak her özelliğin Kişiselleştirme'nin makine öğrenmesi modeli için ne kadar önemli olduğunu değerlendirebilirsiniz. Özellik değerlendirmeleri şunlar için yararlıdır:
- Hangi özelliklerin model için en önemli veya en az önemli olduğunu anlayın.
- Modelde şu anda önemli olan özelliklerden ilham alarak öğrenme açısından faydalı olabilecek ek özellikler için beyin fırtınası yapın.
- Daha fazla analiz veya kaldırma için dikkate alınması gereken önemli veya kullanışlı olmayabilecek özellikleri belirleyin.
- Özellikleri tasarlayıp Kişiselleştirme'ye gönderirken oluşabilecek yaygın sorunları ve hataları giderin. Örneğin GUID'leri, zaman damgalarını veya genellikle seyrek olan diğer özellikleri kullanmak sorunlu olabilir. Özellikleri geliştirme hakkında daha fazla bilgi edinin.
Özellik değerlendirmesi nedir?
Özellik değerlendirmeleri, belirli bir zaman aralığında geçmişe dönük olarak toplanan günlük verileri üzerinde geçerli model yapılandırmanızın bir kopyasını eğiterek ve çalıştırarak yürütülür. Her özellik ile ve olmadan model performansındaki farkı ölçmek için özellikler birer birer yoksayılır. Özellik değerlendirmeleri geçmiş veriler üzerinde gerçekleştirildiğinden, bu desenlerin gelecekteki verilerde gözlemleneceğinin garantisi yoktur. Ancak, günlüğe kaydedilen verileriniz verilerinizin yeterli değişkenliğini veya sabit olmayan özelliklerini yakalamışsa bu içgörüler gelecekteki verilerde geçerli olmaya devam edebilir. Özellik değerlendirmesi çalıştırılarak geçerli modelinizin performansı etkilenmez.
Özellik önem puanı, özelliğin değerlendirme süresi boyunca ödül üzerindeki göreli etkisinin ölçüsüdür. Özellik önem puanları 0 (en az önemli) ile 100 (en önemli) arasında bir sayıdır ve özellik değerlendirmesinde gösterilir. Değerlendirme belirli bir süre boyunca çalıştırıldığından, Kişiselleştirme'ye ek veriler gönderildikçe ve kullanıcılarınız, senaryolarınız ve verileriniz zaman içinde değiştikçe özellik önemleri değişebilir.
Özellik değerlendirmesi oluşturma
Özellik önem puanlarını almak için, özellik önem puanlarını içeren bir rapor oluşturmak üzere günlüğe kaydedilen verilerin bir dönemi boyunca bir özellik değerlendirmesi oluşturmanız gerekir. Bu rapor Azure portalında görüntülenebilir. Özellik değerlendirmesi oluşturmak için:
- Azure portalı web sitesine gidin
- Kişiselleştirme kaynağınızı seçin
- Yan gezinti bölmesinden İzleyici bölümünü seçin
- Özellikler sekmesini seçin
- "Rapor oluştur" seçeneğini belirlediğinizde yeni bir ekran görüntülenmelidir
- Raporunuz için bir ad seçin
- Değerlendirme döneminiz için başlangıç ve bitiş saatlerini seçin
- "Rapor oluştur" seçeneğini belirleyin
Ardından rapor adınız aşağıdaki raporlar tablosunda görünmelidir. Özellik değerlendirmesi oluşturmak, tamamlanma süresinin değerlendirme süresi boyunca Kişiselleştirme'ye gönderilen veri hacmine bağlı olduğu uzun süre çalışan bir işlemdir. Rapor oluşturulurken Durum sütunu değerlendirmeniz için "Çalışıyor" değerini gösterir ve tamamlandıktan sonra "Başarılı" olarak güncelleştirilir. Değerlendirmenizin tamamlandığını görmek için düzenli aralıklarla tekrar kontrol edin.
Kişiselleştirme kaynağınızın günlük verilerine sahip olduğu çeşitli dönemlerde birden çok özellik değerlendirmesi çalıştırabilirsiniz. Eski veriler üzerinde değerlendirmeler yapmanıza olanak tanımak için veri saklama sürenizin yeterince uzun ayarlandığından emin olun.
Özellik önem puanlarını yorumlama
Yüksek önem puanına sahip özellikler
Daha yüksek önem derecelerine sahip özellikler, diğer özelliklere kıyasla değerlendirme döneminde modele daha etkiliydi. Önemli özellikler, modele dahil edilecek ek özelliklerin tasarlanması için ilham verebilir. Örneğin, "IsWeekend" veya "IsWeekday" bağlam özelliklerinin market alışverişi için yüksek öneme sahip olduğunu görürseniz, tatillerin veya uzun hafta sonlarının da önemli faktörler olabileceğinden, bu bilgileri yakalayan özellikler eklemeyi düşünebilirsiniz.
Düşük önem puanına sahip özellikler
Düşük önem derecelerine sahip özellikler, daha fazla analiz için iyi adaylardır. Düşük puanlama özelliklerinin tümü, bir veya daha fazla nedenden dolayı düşük puanlama olabileceği için mutlaka kötü veya kullanışlı değildir. Aşağıdaki liste, özelliklerinizin neden düşük puanlara sahip olabileceğini çözümlemeye başlamanıza yardımcı olabilir:
Bu özellik, değerlendirme döneminde verilerde nadiren gözlemlendi.
- Bu özelliğin oluşum sayısı diğer özelliklere kıyasla düşükse, bu özellik modelin değerli olup olmadığını belirlemesi için yeterince sık sunulmadığını gösterebilir.
Özellik değerleri çok fazla çeşitliliğe veya çeşitlemeye sahip değildi.
- Bu özellik için benzersiz değerlerin sayısı beklediğinizden daha düşükse, bu özellik değerlendirme döneminde çok fazla değişmediğini ve önemli bir içgörü sağlamayacağını gösterebilir.
Özellik değerleri çok gürültülü (rastgele) veya çok farklıydı ve çok az değer sağladı.
- Özellik değerlendirmenizdeki benzersiz değerlerin sayısını denetleyin. Bu özellik için benzersiz değerlerin sayısı beklediğinizden yüksekse veya diğer özelliklere göre yüksekse, bu özellik değerlendirme döneminde çok gürültülü olduğunu gösterebilir.
Veri veya biçimlendirme sorunu var.
- Özelliklerin beklediğiniz şekilde biçimlendirildiğinden ve Kişiselleştirici'ye gönderildiğinden emin olun.
Özellik puanı düşükse ve yukarıdaki nedenler geçerli değilse, bu özellik öğrenme ve performansı modellemek için değerli olmayabilir.
- Modelinizin ortalama ödülü en üst düzeye çıkarmanıza yardımcı olmadığından özelliği kaldırmayı göz önünde bulundurun.
Düşük önem derecelerine sahip özelliklerin kaldırılması, öğrenmeniz için gereken veri miktarını azaltarak model eğitimini hızlandırmaya yardımcı olabilir. Ayrıca modelin performansını da geliştirebilir. Ancak, bu garanti değildir ve daha fazla analiz gerekebilir. Bağlam ve eylem özellikleri tasarlama hakkında daha fazla bilgi edinin.
Özellikleri iyileştirmeye yönelik yaygın sorunlar ve adımlar
Yüksek kardinaliteye sahip özellikler gönderme. Yüksek kardinaliteye sahip özellikler, birçok olay üzerinde yinelenme olasılığı olmayan birçok farklı değere sahip olanlardır. Örneğin, bir kişiye özgü kişisel bilgiler (ad, telefon numarası, kredi kartı numarası, IP adresi gibi) Kişiselleştirici ile kullanılmamalıdır.
Kullanıcı kimlikleri gönderme Çok sayıda kullanıcıyla, bu bilgilerin ortalama ödül puanını en üst düzeye çıkarmak için Kişiselleştirme öğrenmesiyle ilgili olması pek olası değildir. Kullanıcı kimliklerinin gönderilmesi (kişisel bilgiler olmasa bile) modele büyük olasılıkla daha fazla kirlilik katacaktır ve önerilmez.
Özellikler çok seyrek. Değerler ayrıdır ve nadiren birkaç kezden fazla gerçekleşir. Saniyeye kadar hassas zaman damgaları çok seyrek olabilir. Örneğin, zamanları "sabah", "öğlen" veya "öğleden sonra" olarak gruplandırarak daha yoğun (ve dolayısıyla etkili) yapılabilir.
Konum bilgileri genellikle daha geniş sınıflandırmalar oluşturmanın avantajlarından da yararlanır. Örneğin, Lat: 47.67402° N, Uzun: 122.12154° W gibi enlem-boylam koordinatları çok hassastır ve modeli enlem ve boylamı ayrı boyutlar olarak öğrenmeye zorlar. Konum bilgilerini temel alarak kişiselleştirmeye çalışırken, daha büyük kesimlerdeki konum bilgilerini gruplandırmaya yardımcı olur. Bunu yapmanın kolay bir yolu, lat uzun sayılar için uygun bir yuvarlama duyarlığı seçmek ve enlem ve boylamı tek dize yaparak "alanlar" olarak birleştirmektir. Örneğin, yaklaşık birkaç kilometre genişliğindeki bölgelerde Lat: 47.67402° N, Uzun: 122.12154° W'yi temsil etmenin iyi bir yolu "location":"34.3 , 12.1" olabilir.
- Tahmin edilen bilgilerle özellik kümelerini genişletme Zaten sahip olduğunuz bilgilerden türetilebilen keşfedilmemiş öznitelikleri düşünerek daha fazla özellik elde edebilirsiniz. Örneğin kurgusal bir film listesi kişiselleştirmesinde hafta sonu ile hafta içi arasında kullanıcılardan farklı davranışlar elde etmek mümkün mü? "Hafta sonu" veya "hafta içi" özniteliğine sahip olmak için zaman genişletilebilir. Ulusal/bölgesel kültürel tatiller dikkati belirli film türlerine mi çekiyor? Örneğin, "Cadılar Bayramı" özniteliği ilgili yerlerde kullanışlıdır. Yağmurlu havanın birçok kişi için film seçimi üzerinde önemli bir etkisi olabilir mi? Zaman ve yer sayesinde bir hava durumu hizmeti bu bilgileri sağlayabilir ve ek bir özellik olarak ekleyebilirsiniz.
Sonraki adımlar
Kişiselleştirici ile çevrimdışı değerlendirmeyle ilke performanslarını analiz edin.