Öğretici: Azure Machine Learning stüdyosu kod içermeyen AutoML ile sınıflandırma modeli eğitme

Azure Machine Learning stüdyosu Azure Machine Learning otomatik ML kullanarak kod içermeyen AutoML ile sınıflandırma modelini eğitmeyi öğrenin. Bu sınıflandırma modeli, müşterinin bir finans kurumuna sabit vadeli bir depozitoya abone olup olmadığını tahmin eder.

Otomatik ML ile zaman yoğunluklu görevleri otomatikleştirebilirsiniz. Otomatik makine öğrenmesi, seçtiğiniz başarı ölçümünü temel alan en iyi modeli bulmanıza yardımcı olmak için birçok algoritma ve hiper parametre bileşimini hızla yineler.

Bu öğreticide kod yazmayacaksınız, eğitim gerçekleştirmek için stüdyo arabirimini kullanacaksınız. Aşağıdaki görevleri nasıl yapacağınızı öğreneceksiniz:

  • Azure Machine Learning çalışma alanı oluşturun.
  • Otomatik makine öğrenmesi denemesi çalıştırma.
  • Model ayrıntılarını keşfedin.
  • Önerilen modeli dağıtın.

Bu diğer model türleri için otomatik makine öğrenmesini de deneyin:

Önkoşullar

  • Azure aboneliği. Azure aboneliğiniz yoksa ücretsiz hesap oluşturun.

  • bankmarketing_train.csv veri dosyasını indirin. y sütunu, bir müşterinin sabit vadeli bir depozitoya abone olup olmadığını belirtir. Bu, daha sonra bu öğreticideki tahminler için hedef sütun olarak tanımlanır.

Çalışma alanı oluşturma

Azure Machine Learning çalışma alanı, bulutta makine öğrenmesi modellerini denemek, eğitmek ve dağıtmak için kullandığınız temel bir kaynaktır. Azure aboneliğinizi ve kaynak grubunuzu hizmette kolayca kullanılan bir nesneye bağlar.

Bu öğreticide, çalışma alanı oluşturmak ve öğreticiye devam etmek için aşağıdaki adımları tamamlayın.

  1. Azure Machine Learning stüdyosu oturum açma

  2. Çalışma alanı oluştur'u seçin

  3. Yeni çalışma alanınızı yapılandırmak için aşağıdaki bilgileri sağlayın:

Alan Açıklama
Çalışma alanı adı Çalışma alanınızı tanımlayan benzersiz bir ad girin. Adların kaynak grubu genelinde benzersiz olması gerekir. Geri çağırması kolay bir ad kullanın ve başkaları tarafından oluşturulan çalışma alanlarından ayırt edin. Çalışma alanı adı büyük/küçük harfe duyarlı değildir.
Abonelik Kullanmak istediğiniz Azure aboneliğini seçin.
Kaynak grubu Aboneliğinizde mevcut kaynak gruplarından birini seçin veya bir ad girerek yeni bir kaynak grubu oluşturun. Kaynak grubu, Bir Azure çözümü için ilgili kaynakları barındırır. Mevcut bir kaynak grubunu kullanmak için katkıda bulunan veya sahip rolüne ihtiyacınız vardır. Erişim hakkında daha fazla bilgi için bkz . Azure Machine Learning çalışma alanına erişimi yönetme.
Bölge Çalışma alanınızı oluşturmak için kullanıcılarınıza en yakın Azure bölgesini ve veri kaynaklarını seçin.
  1. Çalışma alanını oluşturmak için Oluştur'u seçin

Azure kaynakları hakkında daha fazla bilgi için, başlamak için ihtiyacınız olan kaynakları oluşturma başlıklı bu makaledeki adımlara bakın.

Azure'da çalışma alanı oluşturmanın diğer yolları için portalda veya Python SDK'sı (v2) ile Azure Machine Learning çalışma alanlarını yönetin.

Otomatik Makine Öğrenmesi işi oluşturma

Aşağıdaki deneme kurulumunu tamamlar ve tüm beceri düzeylerindeki veri bilimi uygulayıcıları için veri bilimi senaryoları gerçekleştirmek için makine öğrenmesi araçlarını içeren birleştirilmiş bir web arabirimi olan Azure Machine Learning stüdyosu https://ml.azure.comaracılığıyla adımları çalıştırırsınız. Stüdyo Internet Explorer tarayıcılarında desteklenmez.

  1. Aboneliğinizi ve oluşturduğunuz çalışma alanını seçin.

  2. Sol bölmede, Yazma bölümünün altında Otomatik ML'yi seçin.

    Bu ilk otomatik ML denemeniz olduğundan boş bir liste ve belgelere bağlantılar görürsünüz.

    Kullanmaya başlayın sayfası

  3. +Yeni otomatik ML işi'ni seçin.

  4. Otomatik olarak eğit'i seçin

  5. İşi yapılandırmayı başlat'ı seçin

  6. Deneme adı bölümünde Yeni oluştur seçeneğini belirleyin ve şu deneme adını girin:my-1st-automl-experiment

Veri kümesi oluşturma ve veri varlığı olarak yükleme

Denemenizi yapılandırmadan önce veri dosyanızı Azure Machine Learning veri varlığı biçiminde çalışma alanınıza yükleyin. Bu öğreticide veri varlığını AutoML işi için veri kümeniz olarak düşünebilirsiniz. Bunu yaptığınızda, verilerinizin denemeniz için uygun şekilde biçimlendirildiğinden emin olmanıza olanak tanır.

  1. Görev türünüz olarak Sınıflandır'ı seçin.

  2. Oluştur'u seçerek yeni bir veri varlığı oluşturun.

    1. Temel bilgi formunda, veri varlığınıza bir ad verin ve isteğe bağlı bir açıklama sağlayın. Otomatik ML arabirimi şu anda yalnızca TabularDatasets'i desteklediğinden, veri kümesi türünün varsayılan olarak Tablosal olması gerekir.

    2. Sol alttaki İleri'yi seçin

    3. Veri deposu ve dosya seçimi formunda, çalışma alanı oluşturma işleminiz (workspaceblobstore (Azure Blob Depolama) sırasında otomatik olarak ayarlanan varsayılan veri depolarını seçin. Veri dosyanızı çalışma alanınızda kullanılabilir hale getirmek için karşıya yükleyebileceğiniz yer burasıdır.

    4. Karşıya yükle açılan listesinden Dosyaları karşıya yükle'yi seçin.

    5. Yerel bilgisayarınızda bankmarketing_train.csv dosyasını seçin. Bu, önkoşul olarak indirdiğiniz dosyadır.

    6. Çalışma alanı oluşturma sırasında otomatik olarak ayarlanan varsayılan kapsayıcıya yüklemek için sol alttaki İleri'yi seçin.

      Karşıya yükleme tamamlandığında, Ayarlar ve önizleme formu dosya türüne göre önceden doldurulur.

    7. Verilerinizin Şema formu aracılığıyla düzgün biçimlendirildiğini doğrulayın. Veriler aşağıdaki gibi doldurulmalıdır. Verilerin doğru olduğunu doğruladıktan sonra İleri'yi seçin.

      Alan Açıklama Öğreticinin değeri
      Dosya biçimi Bir dosyada depolanan verilerin düzenini ve türünü tanımlar. Sınırlandırılmış
      Sınırlayıcı Düz metin veya diğer veri akışlarında ayrı, bağımsız bölgeler arasındaki sınırı belirtmek için bir veya daha fazla karakter. Comma
      Kodlama Veri kümenizi okumak için hangi bit-karakter şeması tablosunun kullanılacağını tanımlar. UTF-8
      Sütun üst bilgileri Varsa veri kümesinin üst bilgilerinin nasıl ele alınacağını gösterir. Tüm dosyaların üst bilgileri aynı
      Satırları atla Varsa, veri kümesinde kaç satırın atlanmış olduğunu gösterir. Hiçbiri
    8. Şema formu, bu deneme için verilerinizin daha fazla yapılandırılmasını sağlar. Bu örnekte, day_of_week dahil edilmemesi için iki durumlu düğmeyi seçin. İleri'yi seçin. Şema formu

    9. Ayrıntıları onayla formunda, bilgilerin Temel bilgiler, Veri deposu ve dosya seçimi ile Ayarlar ve önizleme formlarında önceden doldurulan bilgilerle eşleşip eşleşmedığını doğrulayın.

    10. Veri kümenizin oluşturulmasını tamamlamak için Oluştur'u seçin.

    11. Listede göründüğünde veri kümenizi seçin.

    12. Veri varlığını seçip day_of_week eklemediğinizden emin olmak için doldurulan önizleme sekmesine bakarak verileri gözden geçirin ve Kapat'ı seçin.

    13. İleri'yi seçin.

İşi yapılandırma

Verilerinizi yükleyip yapılandırdıktan sonra denemenizi ayarlayabilirsiniz. Bu kurulum, işlem ortamınızın boyutunu seçme ve tahmin etmek istediğiniz sütunu belirtme gibi deneme tasarım görevlerini içerir.

  1. İşi Yapılandır formunu aşağıdaki gibi doldurun:

    1. Tahmin etmek istediğiniz hedef sütun olarak y'yi seçin. Bu sütun, müşterinin bir dönem depozitosunun abone olup olmadığını gösterir.

    2. Ek yapılandırma ayarlarını görüntüle'yi seçin ve alanları aşağıdaki gibi doldurun. Bu ayarlar, eğitim işini daha iyi denetlemek için kullanılır. Aksi takdirde, varsayılanlar deneme seçimine ve verilere göre uygulanır.

      Ek yapılandırmalar Açıklama Öğreticinin değeri
      Birincil ölçüm Makine öğrenmesi algoritmasının ölçüleceği değerlendirme ölçümü. AUC_weighted
      En iyi modeli açıklama Otomatik ML tarafından oluşturulan en iyi modelde açıklanabilirliği otomatik olarak gösterir. Etkinleştir
      Engellenen algoritmalar Eğitim işinden dışlamak istediğiniz algoritmalar Hiçbiri
      Ek sınıflandırma ayarları Bu ayarlar modelinizin doğruluğunu geliştirmeye yardımcı olur Pozitif sınıf etiketi: Yok
      Çıkış ölçütü Bir ölçüt karşılanırsa, eğitim işi durdurulur. Eğitim işi süresi (saat): 1
      Ölçüm puanı eşiği: Yok
      Eşzamanlılık Yineleme başına yürütülen en fazla paralel yineleme sayısı En fazla eşzamanlı yineleme: 5
    3. Kaydet'i seçin.

  2. [İsteğe bağlı] Doğrulama ve test formunda,

    1. Doğrulama türünüz olarak k katlanmış çapraz doğrulamayı seçin.
    2. Çapraz doğrulama sayısı olarak 2'yi seçin.
  3. İleri'yi seçin

  4. İşlem türünüz olarak işlem kümesi'ne tıklayın.

  5. İşlem hedefi, eğitim betiğinizi çalıştırmak veya hizmet dağıtımınızı barındırmak için kullanılan yerel veya bulut tabanlı bir kaynak ortamıdır. Bu deneme için bulut tabanlı sunucusuz işlem (önizleme) deneyebilir veya kendi bulut tabanlı işleminizi oluşturabilirsiniz.

    1. Sunucusuz işlem kullanmak için önizleme özelliğini etkinleştirin, Sunucusuz'a tıklayın ve bu adımın geri kalanını atlayın.
      1. Kendi işlem hedefinizi oluşturmak için işlem hedefinizi yapılandırmak için +Yeni'yi seçin.

      2. İşleminizi ayarlamak için Sanal makine seçin formunu doldurun.

        Alan Açıklama Öğreticinin değeri
        Konum Makineyi çalıştırmak istediğiniz bölge Batı ABD 2
        Sanal makine katmanı Denemenizin hangi önceliğe sahip olması gerektiğini seçin Ayrılmış
        Sanal makine türü İşleminiz için sanal makine türünü seçin. CPU (Merkezi İşlem Birimi)
        Sanal makine boyutu İşleminizin sanal makine boyutunu seçin. Verilerinize ve deneme türünüz temelinde önerilen boyutların listesi sağlanır. Standard_DS12_V2
      3. Ayarları yapılandır formunu doldurmak için İleri'yi seçin.

        Alan Açıklama Öğreticinin değeri
        İşlem adı İşlem bağlamınızı tanımlayan benzersiz bir ad. automl-compute
        Min / Max düğümleri Verilerin profilini belirlemek için 1 veya daha fazla düğüm belirtmeniz gerekir. En küçük düğümler: 1
        En fazla düğüm sayısı: 6
        Ölçeği azaltmadan önce boşta kalan saniyeler Küme otomatik olarak en düşük düğüm sayısına ölçeklendirilmeden önce boşta kalma süresi. 120 (varsayılan)
        Gelişmiş ayarlar Denemeniz için bir sanal ağı yapılandırma ve yetkilendirme ayarları. Hiçbiri
      4. İşlem hedefinizi oluşturmak için Oluştur'u seçin.

        Bu işlemin tamamlanması birkaç dakika sürer.

        Ayarlar sayfası

      5. Oluşturma işleminden sonra açılan listeden yeni işlem hedefinizi seçin.

  6. İleri'yi seçin.

  7. Denemeyi çalıştırmak için Eğitim işini gönder'i seçin. Deneme hazırlığı başlarken İş durumu en üstte olacak şekilde İşe genel bakış ekranı açılır. Deneme ilerledikçe bu durum güncelleştirilir. Denemenizin durumu hakkında sizi bilgilendirmek için stüdyonun sağ üst köşesinde bildirimler de görüntülenir.

Önemli

Deneme çalıştırmasının hazırlanması 10-15 dakika sürer. Çalıştırıldıktan sonra, her yineleme için 2-3 dakika daha fazla sürer.

Üretimde muhtemelen biraz uzaklaşırsınız. Ancak bu öğretici için, diğerleri çalışmaya devam ederken modeller sekmesinde test edilen algoritmaları incelemeye başlamanızı öneririz.

Modelleri keşfetme

Algoritmaların (modellerin) test edilmiş olduğunu görmek için Modeller sekmesine gidin. Varsayılan olarak, modeller tamamlandıklarında ölçüm puanına göre sıralanır. Bu öğreticide, seçilen AUC_weighted ölçümüne göre en yüksek puanı alan model listenin en üstünde yer alır.

Tüm deneme modellerinin tamamlanmasını beklerken tamamlanan modelin algoritma adını seçerek performans ayrıntılarını inceleyin.

Aşağıda, seçilen modelin özelliklerini, ölçümlerini ve performans grafiklerini görüntülemek için Ayrıntılar ve Ölçümler sekmelerinde gezinilir.

Yineleme ayrıntısı çalıştırma

Model açıklamaları

Modellerin tamamlanmasını beklerken, model açıklamalarına da göz atabilir ve belirli bir modelin tahminlerini hangi veri özelliklerinin (ham veya mühendislik) etkilediğini görebilirsiniz.

Bu model açıklamaları isteğe bağlı olarak oluşturulabilir ve Açıklamalar (önizleme) sekmesinin parçası olan model açıklamaları panosunda özetlenir.

Model açıklamaları oluşturmak için

  1. Modeller ekranına dönmek için üst kısımdaki İş 1'i seçin.

  2. Modeller sekmesini seçin.

  3. Bu öğretici için ilk MaxAbsScaler, LightGBM modelini seçin.

  4. Üst kısımdaki Modeli açıkla düğmesini seçin. Sağ tarafta Modeli açıkla bölmesi görüntülenir.

  5. Daha önce oluşturduğunuz automl-compute öğesini seçin. Bu işlem kümesi, model açıklamalarını oluşturmak için bir alt iş başlatır.

  6. En alttaki Oluştur'u seçin. Ekranınızın üst kısmında yeşil bir başarı iletisi görüntülenir.

    Not

    Açıklanabilirlik işinin tamamlanması yaklaşık 2-5 dakika sürer.

  7. Açıklamalar (önizleme) düğmesini seçin. Bu sekme, açıklanabilirlik çalıştırması tamamlandıktan sonra doldurulur.

  8. Sol taraftaki bölmeyi genişletin ve Özellikler'in altında ham yazan satırı seçin.

  9. Sağ taraftaki Toplama özelliği önem derecesi sekmesini seçin. Bu grafik, seçilen modelin tahminlerini etkileyen veri özelliklerini gösterir.

    Bu örnekte, sürenin bu modelin tahminleri üzerinde en fazla etkiye sahip olduğu görülmektedir.

    Model açıklaması panosu

En iyi modeli dağıtma

Otomatik makine öğrenmesi arabirimi, en iyi modeli birkaç adımda web hizmeti olarak dağıtmanıza olanak tanır. Dağıtım, modelin tümleştirilmesidir, böylece yeni veriler hakkında tahminde bulunabilir ve olası fırsat alanlarını belirleyebilir.

Bu deneme için bir web hizmetine dağıtım, finansal kurumun artık olası sabit dönemli depozito müşterilerini tanımlamak için yinelemeli ve ölçeklenebilir bir web çözümüne sahip olduğu anlamına gelir.

Deneme çalıştırmanızın tamam olup olmadığını denetleyin. Bunu yapmak için ekranınızın üst kısmındaki İş 1'i seçerek üst iş sayfasına geri dönün. Ekranın sol üst kısmında Tamamlandı durumu gösterilir.

Deneme çalıştırması tamamlandıktan sonra Ayrıntılar sayfası En iyi model özeti bölümüyle doldurulur. Bu deneme bağlamında VotingEnsemble, AUC_weighted ölçümüne göre en iyi model olarak kabul edilir.

Bu modeli dağıtıyoruz ancak dağıtımın tamamlanması yaklaşık 20 dakika sürer. Dağıtım işlemi modeli kaydetme, kaynak oluşturma ve bunları web hizmeti için yapılandırma gibi çeşitli adımları içerir.

  1. Modele özgü sayfayı açmak için VotingEnsemble öğesini seçin.

  2. Sol üst kısımdaki Dağıt menüsünü ve ardından Web hizmetine dağıt'ı seçin.

  3. Model dağıtma bölmesini aşağıdaki gibi doldurun:

    Alan Değer
    Dağıtım adı my-automl-deploy
    Dağıtım açıklaması İlk otomatik makine öğrenmesi denemesi dağıtımım
    İşlem türü Azure Container Instance (ACI) seçeneğini belirleyin
    Kimlik doğrulamayı etkinleştir Devre Dışı.
    Özel dağıtımları kullanma Devre Dışı. Varsayılan sürücü dosyasının (puanlama betiği) ve ortam dosyasının otomatik olarak oluşturulmasını sağlar.

    Bu örnekte, Gelişmiş menüsünde sağlanan varsayılan değerleri kullanırız.

  4. Dağıt'ı seçin.

    İş ekranının üst kısmında yeşil bir başarı iletisi görüntülenir ve Model özeti bölmesinde Durumu dağıt altında bir durum iletisi görüntülenir. Dağıtım durumunu denetlemek için Düzenli aralıklarla yenile'yi seçin.

Artık tahminler oluşturmak için operasyonel bir web hizmetiniz var.

Yeni web hizmetinizi kullanma hakkında daha fazla bilgi edinmek ve Power BI'ın yerleşik Azure Machine Learning desteğini kullanarak tahminlerinizi test etmek için Sonraki Adımlar'a geçin.

Kaynakları temizleme

Dağıtım dosyaları veri ve deneme dosyalarından daha büyük olduğundan depolama maliyeti daha yüksektir. Hesabınıza maliyetleri en aza indirmek için veya çalışma alanınızı korumak ve dosyaları denemek istiyorsanız yalnızca dağıtım dosyalarını silin. Aksi takdirde, dosyalardan herhangi birini kullanmayı planlamıyorsanız kaynak grubunun tamamını silin.

Dağıtım örneğini silme

Diğer öğreticiler ve keşifler için kaynak grubunu ve çalışma alanını korumak istiyorsanız azure machine learning'den https://ml.azure.com/yalnızca dağıtım örneğini silin.

  1. Azure Machine Learning'e gidin. Çalışma alanınıza gidin ve sol taraftaki Varlıklar bölmesinin altında Uç Noktalar'ı seçin.

  2. Silmek istediğiniz dağıtımı seçin ve Sil'i seçin.

  3. Devam Et'i seçin.

Kaynak grubunu silme

Önemli

Oluşturduğunuz kaynaklar, diğer Azure Machine Learning öğreticileri ve nasıl yapılır makaleleri için önkoşul olarak kullanılabilir.

Oluşturduğunuz kaynaklardan hiçbirini kullanmayı planlamıyorsanız, ücret ödememek için bunları silin:

  1. Azure portalının en sol tarafındaki Kaynak gruplarını seçin.

  2. Listeden, oluşturduğunuz kaynak grubunu seçin.

  3. Kaynak grubunu sil'i seçin.

    Azure portalında kaynak grubunu silme seçimlerinin ekran görüntüsü.

  4. Kaynak grubu adını girin. Ardından Sil'i seçin.

Sonraki adımlar

Bu otomatik makine öğrenmesi öğreticisinde, sınıflandırma modeli oluşturmak ve dağıtmak için Azure Machine Learning'in otomatik ML arabirimini kullandınız. Daha fazla bilgi ve sonraki adımlar için şu makalelere bakın:

Not

Bu Banka Pazarlama veri kümesi Creative Commons (CCO: Public Domain) Lisansı altında kullanıma sunulmuştur. Veritabanının tek tek içeriğindeki tüm haklar, Veritabanı İçeriği Lisansı kapsamında lisanslandırılır ve Kaggle'da kullanılabilir. Bu veri kümesi ilk olarak UCI Machine Learning Veritabanı'nın içinde kullanılabilirdi.

[Moro ve diğerleri, 2014] S. Moro, P. Cortez ve P. Rita. Banka Telemarketing'in Başarısını Tahmin Etmek için Veri Odaklı Bir Yaklaşım. Karar Destek Sistemleri, Elsevier, 62:22-31, Haziran 2014.