İki Sınıflı Artırılmış Karar Ağacı bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Artırılmış karar ağaçları algoritmasını temel alan bir makine öğrenmesi modeli oluşturmak için bu bileşeni kullanın.

Hızlandırılmış karar ağacı, ikinci ağacın ilk ağacın hatalarını düzeltdiği, üçüncü ağacın birinci ve ikinci ağaçların hatalarını düzeltdiği ve vb. bir öğrenme yöntemidir. Tahminler, tahminde bulunan ağaç topluluğunun tamamını temel alır.

Genel olarak, doğru yapılandırıldığında, artırılmış karar ağaçları çok çeşitli makine öğrenmesi görevlerinde en iyi performansı elde etmek için en kolay yöntemlerdir. Ancak bunlar aynı zamanda bellek açısından yoğun bilgi sahibi olan öğrencilerden biridir ve geçerli uygulama bellekteki her şeyi barındırıyor. Bu nedenle, artırılmış bir karar ağacı modeli bazı doğrusal öğrencilerin işleyebileceği büyük veri kümelerini işleyemeyebilir.

Bu bileşen LightGBM algoritmasına dayanır.

Yapılandırma

Bu bileşen eğitilmemiş bir sınıflandırma modeli oluşturur. Sınıflandırma denetimli bir öğrenme yöntemi olduğundan modeli eğitmek için tüm satırlar için bir değere sahip etiket sütunu içeren etiketli bir veri kümesine ihtiyacınız vardır.

Modeli Eğit'i kullanarak bu tür bir modeli eğitebilirsiniz.

  1. Azure Machine Learning'de artırılmış karar ağacı bileşenini işlem hattınıza ekleyin.

  2. Eğitmen modu oluştur seçeneğini ayarlayarak modelin nasıl eğitileceğini belirtin.

    • Tek Parametre: Modeli nasıl yapılandırmak istediğinizi biliyorsanız, bağımsız değişken olarak belirli bir değer kümesi sağlayabilirsiniz.

    • Parametre Aralığı: En iyi parametrelerden emin değilseniz, Modeli Ayarlama Hiper Parametreleri bileşenini kullanarak en uygun parametreleri bulabilirsiniz. Bazı değerler aralığı sağlarsınız ve eğitmen, en iyi sonucu veren değerlerin birleşimini belirlemek için ayarların birden çok bileşimini yineler.

  3. Ağaç başına en fazla yaprak sayısı için, herhangi bir ağaçta oluşturulabilecek en fazla terminal düğümü (yaprak) sayısını belirtin.

    Bu değeri artırarak, fazla uygunluk ve daha uzun eğitim süresi riski altında, büyük olasılıkla ağacın boyutunu büyütüp daha iyi bir hassasiyet elde edersiniz.

  4. Yaprak düğüm başına en az örnek sayısı için, bir ağaçta herhangi bir terminal düğümü (yaprak) oluşturmak için gereken durum sayısını belirtin.

    Bu değeri artırarak yeni kurallar oluşturma eşiğini artırırsınız. Örneğin, varsayılan değer 1 olduğunda, tek bir büyük/küçük harf bile yeni bir kuralın oluşturulmasına neden olabilir. Değeri 5'e artırırsanız, eğitim verilerinin aynı koşullara uyan en az beş servis talebi içermesi gerekir.

  5. Öğrenme oranı için, öğrenme sırasında adım boyutunu tanımlayan 0 ile 1 arasında bir sayı yazın.

    Öğrenme hızı, öğrencilerin en uygun çözüm üzerinde ne kadar hızlı veya yavaş bir şekilde yakınsadığını belirler. Adım boyutu çok büyükse, en uygun çözümü fazla kullanabilirsiniz. Adım boyutu çok küçükse eğitimin en iyi çözüme yakınsanmasını sağlamak daha uzun sürer.

  6. Inşa edilen ağaç sayısı için, toplulukta oluşturulacak karar ağaçlarının toplam sayısını belirtin. Daha fazla karar ağacı oluşturarak, potansiyel olarak daha iyi kapsama alabilirsiniz, ancak eğitim süresi artar.

    Değeri 1 olarak ayarlarsanız, yalnızca bir ağaç (ilk parametre kümesini içeren ağaç) oluşturulur ve başka yineleme yapılmaz.

  7. Rastgele sayı tohumu için isteğe bağlı olarak, rastgele tohum değeri olarak kullanılacak negatif olmayan bir tamsayı yazın. Bir tohum belirtmek, aynı veri ve parametrelere sahip çalıştırmalar arasında yeniden üretilebilirlik sağlar.

    Rastgele tohum varsayılan olarak 0 olarak ayarlanır ve bu da ilk tohum değerinin sistem saatinden alındığı anlamına gelir. Rastgele bir tohum kullanan ardışık çalıştırmaların sonuçları farklı olabilir.

  8. Modeli eğitme:

    • Eğitmen modu oluştur'u Tek Parametre olarak ayarlarsanız etiketli bir veri kümesini ve Modeli Eğitme bileşenini bağlayın.

    • Eğitmen modu oluştur'u Parametre Aralığı olarak ayarlarsanız etiketli bir veri kümesini bağlayın ve Modeli Ayarlama Hiper Parametreleri'ni kullanarak modeli eğitin.

    Not

    Modeli Eğitme'ye bir parametre aralığı geçirirseniz, yalnızca tek parametre listesindeki varsayılan değeri kullanır.

    Ayarlama Modeli Hiper Parametreleri bileşenine tek bir parametre değeri kümesi geçirirseniz, her parametre için bir ayar aralığı beklediğinde değerleri yoksayar ve öğrenci için varsayılan değerleri kullanır.

    Parametre Aralığı seçeneğini belirleyip herhangi bir parametre için tek bir değer girerseniz, diğer parametreler bir değer aralığında değişse bile, belirttiğiniz tek değer süpürme boyunca kullanılır.

Sonuçlar

Eğitim tamamlandıktan sonra:

  • Eğitilen modelin anlık görüntüsünü kaydetmek için Modeli eğit bileşeninin sağ panelindeki Çıkışlar sekmesini seçin. Modeli yeniden kullanılabilir bir bileşen olarak kaydetmek için Veri kümesini kaydet simgesini seçin.

  • Modeli puanlama için kullanmak için Model Puanlama bileşenini bir işlem hattına ekleyin.

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.