Öğretici: Makine öğrenmesi modelini kod olmadan eğitme (kullanım dışı)

Otomatik makine öğrenmesi kullanarak eğitebileceğiniz yeni makine öğrenmesi modelleri ile Spark tablolarındaki verilerinizi zenginleştirebilirsiniz. Azure Synapse Analytics'te, makine öğrenmesi modelleri oluşturmaya yönelik eğitim veri kümesi olarak kullanmak üzere çalışma alanında bir Spark tablosu seçebilir ve bunu kodsuz bir deneyimde yapabilirsiniz.

Bu öğreticide Synapse Studio'da kod içermeyen bir deneyim kullanarak makine öğrenmesi modellerini eğitmeyi öğreneceksiniz. Synapse Studio, Azure Synapse Analytics'in bir özelliğidir.

Deneyimi el ile kodlamak yerine Azure Machine Learning'de otomatik makine öğrenmesini kullanacaksınız. Eğitdiğiniz modelin türü, çözmeye çalıştığınız soruna bağlıdır. Bu öğreticide, New York City taksi veri kümesinden taksi ücretlerini tahmin etmek için bir regresyon modeli kullanacaksınız.

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Uyarı

  • Azure Synapse, 29 Eylül 2023 tarihinden itibaren Spark 2.4 Çalışma Zamanları için resmi desteği sona erdirecektir. 29 Eylül 2023'ün ardından Spark 2.4 ile ilgili destek biletlerine değinmeyeceksiniz. Spark 2.4 için hata veya güvenlik düzeltmeleri için yayın işlem hattı yoktur. Spark 2.4'ün destek kesme tarihinden sonra kullanımı kendi riski altındadır. Olası güvenlik ve işlevsellik endişeleri nedeniyle kullanılmaya devam etmemesi kesinlikle önerilmez.
  • Apache Spark 2.4'ün kullanımdan kaldırılması işleminin bir parçası olarak, Azure Synapse Analytics'teki AutoML'nin de kullanım dışı bırakılacağını bildirmek isteriz. Buna hem düşük kod arabirimi hem de kod aracılığıyla AutoML denemeleri oluşturmak için kullanılan API'ler dahildir.
  • AutoML işlevinin yalnızca Spark 2.4 çalışma zamanı aracılığıyla kullanılabildiğini lütfen unutmayın.
  • AutoML özelliklerinden yararlanmaya devam etmek isteyen müşteriler için verilerinizi Azure Data Lake Storage 2. Nesil (ADLSg2) hesabınıza kaydetmenizi öneririz. Buradan Azure Machine Learning (AzureML) aracılığıyla AutoML deneyimine sorunsuz bir şekilde erişebilirsiniz. Bu geçici çözümle ilgili daha fazla bilgiyi burada bulabilirsiniz.

Önkoşullar

  • Azure Synapse Analytics çalışma alanı. Varsayılan depolama alanı olarak yapılandırılmış bir Azure Data Lake Storage 2. Nesil depolama hesabına sahip olduğundan emin olun. Birlikte çalıştığınız Data Lake Storage 2. Nesil dosya sistemi için Depolama Blob Veri Katkıda Bulunanı olduğunuzdan emin olun.
  • Azure Synapse Analytics çalışma alanınızda bir Apache Spark havuzu (sürüm 2.4). Ayrıntılar için bkz . Hızlı Başlangıç: Synapse Studio kullanarak sunucusuz Apache Spark havuzu oluşturma.
  • Azure Synapse Analytics çalışma alanınızda bir Azure Machine Learning bağlı hizmeti. Ayrıntılar için bkz . Hızlı Başlangıç: Azure Synapse Analytics'te yeni bir Azure Machine Learning bağlı hizmeti oluşturma.

Azure portalda oturum açma

Azure Portal’ında oturum açın.

Eğitim veri kümesi için Spark tablosu oluşturma

Bu öğretici için bir Spark tablosuna ihtiyacınız vardır. Aşağıdaki not defteri bir tane oluşturur:

  1. Create-Spark-Table-NYCTaxi- Data.ipynb not defterini indirin.

  2. Not defterini Synapse Studio'ya aktarın.

    İçeri Aktarma seçeneğinin vurgulandığı Azure Synapse Analytics'in ekran görüntüsü.

  3. Kullanmak istediğiniz Spark havuzunu seçin ve ardından Tümünü çalıştır'ı seçin. Bu adım, açık veri kümesinden New York taksi verilerini alır ve verileri varsayılan Spark veritabanınıza kaydeder.

    Tümünü çalıştır ve Spark veritabanı vurgulanmış şekilde Azure Synapse Analytics'in ekran görüntüsü.

  4. Not defteri çalıştırması tamamlandıktan sonra, varsayılan Spark veritabanının altında yeni bir Spark tablosu görürsünüz. Veri'de nyc_taxi adlı tabloyu bulun.

    Yeni tablonun vurgulandığı Azure Synapse Analytics Veri sekmesinin ekran görüntüsü.

Otomatik makine öğrenmesi sihirbazını açma

Sihirbazı açmak için önceki adımda oluşturduğunuz Spark tablosuna sağ tıklayın. Ardından Machine Learning>Yeni model eğit'i seçin.

Machine Learning ve Yeni bir model eğit seçeneğinin vurgulandığı Spark tablosunun ekran görüntüsü.

Model türü seçin

Yanıtlamaya çalıştığınız soruya göre deneme için makine öğrenmesi modeli türünü seçin. Tahmin etmeye çalıştığınız değer sayısal (taksi ücretleri) olduğundan burada Regresyon'ı seçin. Daha sonra Devam seçeneğini belirleyin.

Regresyon vurgulanmış şekilde Yeni model eğitme işleminin ekran görüntüsü.

Denemeyi yapılandırma

  1. Azure Machine Learning'de otomatik makine öğrenmesi denemesi çalıştırması oluşturmaya yönelik yapılandırma ayrıntılarını sağlayın. Bu çalıştırma birden çok modeli eğitmektedir. Başarılı bir çalıştırmanın en iyi modeli Azure Machine Learning model kayıt defterine kaydedilir.

    Makine öğrenmesi modelini eğitmeye yönelik yapılandırma belirtimlerinin ekran görüntüsü.

    • Azure Machine Learning çalışma alanı: Otomatik makine öğrenmesi denemesi çalıştırması oluşturmak için bir Azure Machine Learning çalışma alanı gereklidir. Ayrıca bağlı bir hizmet kullanarak Azure Synapse Analytics çalışma alanınızı Azure Machine Learning çalışma alanına bağlamanız gerekir. Tüm önkoşulları yerine getirdikten sonra, bu otomatik çalıştırma için kullanmak istediğiniz Azure Machine Learning çalışma alanını belirtebilirsiniz.

    • Deneme adı: Deneme adını belirtin. Otomatik makine öğrenmesi çalıştırması gönderdiğinizde bir deneme adı sağlarsınız. Çalıştırma bilgileri, Azure Machine Learning çalışma alanında bu denemenin altında depolanır. Bu deneyim varsayılan olarak yeni bir deneme oluşturur ve önerilen bir ad oluşturur, ancak var olan bir denemenin adını da sağlayabilirsiniz.

    • En iyi model adı: Otomatik çalıştırmadan en iyi modelin adını belirtin. En iyi modele bu ad verilir ve bu çalıştırmadan sonra otomatik olarak Azure Machine Learning model kayıt defterine kaydedilir. Otomatik makine öğrenmesi çalıştırması birçok makine öğrenmesi modeli oluşturur. Sonraki bir adımda seçtiğiniz birincil ölçüme bağlı olarak, bu modeller karşılaştırılabilir ve en iyi model seçilebilir.

    • Hedef sütun: Modelin tahmin etmek için eğitileceği sütun budur. Veri kümesinde tahmin etmek istediğiniz verileri içeren sütunu seçin. Bu öğreticide hedef sütun fareAmount olarak sayısal sütunu seçin.

    • Spark havuzu: Otomatik deneme çalıştırması için kullanmak istediğiniz Spark havuzunu belirtin. Hesaplamalar, belirttiğiniz havuzda çalıştırılır.

    • Spark yapılandırma ayrıntıları: Spark havuzuna ek olarak oturum yapılandırma ayrıntılarını sağlama seçeneğiniz de vardır.

  2. Devam'ı seçin.

Modeli yapılandırma

Önceki bölümde model türünüz olarak Regresyon'ı seçtiğinizden, aşağıdaki yapılandırmalar kullanılabilir (Sınıflandırma modeli türü için de kullanılabilir):

  • Birincil ölçüm: Modelin ne kadar iyi durumda olduğunu ölçen ölçümü girin. Otomatik çalıştırmada oluşturulan farklı modelleri karşılaştırmak ve en iyi performansı gösteren modeli belirlemek için bu ölçümü kullanırsınız.

  • Eğitim işi süresi (saat):Bir denemenin modelleri çalıştırması ve eğitilmesi için saat cinsinden en fazla süreyi belirtin. 1'den küçük değerler de sağlayabileceğinizi unutmayın (örneğin, 0,5).

  • En fazla eşzamanlı yineleme: Paralel çalışan en fazla yineleme sayısını seçin.

  • ONNX model uyumluluğu: Bu seçeneği etkinleştirirseniz, otomatik makine öğrenmesi tarafından eğitilen modeller ONNX biçimine dönüştürülür. Bu özellikle modeli Azure Synapse Analytics SQL havuzlarında puanlama için kullanmak istiyorsanız geçerlidir.

Bu ayarların tümünün özelleştirebileceğiniz varsayılan bir değeri vardır.

Regresyon modelini yapılandırmaya yönelik ek yapılandırmaların ekran görüntüsü.

Çalıştırma başlatma

Gerekli tüm yapılandırmalar tamamlandıktan sonra otomatik çalıştırmanızı başlatabilirsiniz. Çalıştırma oluştur'u seçerek doğrudan çalıştırma oluşturmayı seçebilirsiniz. Bu işlem çalıştırmayı kod olmadan başlatır. Alternatif olarak, kodu tercih ederseniz Not defterinde aç'ı seçebilirsiniz. Bu işlem, çalıştırmayı oluşturan kodu içeren bir not defterini açar, böylece kodu görüntüleyebilir ve çalıştırmayı kendiniz başlatabilirsiniz.

'Çalıştırma oluştur' veya 'not defterinde aç' seçeneklerinin ekran görüntüsü.

Not

Önceki bölümde model türünüz olarak Zaman serisi tahminini seçtiyseniz, ek yapılandırmalar yapmanız gerekir. Tahmin, ONNX modeli uyumluluğunu da desteklemez.

Doğrudan çalıştırma oluşturma

Otomatik makine öğrenmesi çalıştırmanızı doğrudan başlatmak için Çalıştır Oluştur'u seçin. Çalıştırmanın başlatıldığını belirten bir bildirim görürsünüz. Ardından başarılı olduğunu belirten başka bir bildirim görürsünüz. Ayrıca bildirimdeki bağlantıyı seçerek Azure Machine Learning'deki durumu de kontrol edebilirsiniz.

Başarılı bildirimin ekran görüntüsü.

Not defteriyle çalıştırma oluşturma

Not defteri oluşturmak için Not Defterinde Aç'ı seçin. Bu size ayarları ekleme veya otomatik makine öğrenmesi çalıştırmanızın kodunu başka bir şekilde değiştirme fırsatı verir. Kodu çalıştırmaya hazır olduğunuzda Tümünü çalıştır'ı seçin.

Tümünü çalıştır seçeneğinin vurgulandığı not defterinin ekran görüntüsü.

Çalıştırmayı izleme

Çalıştırmayı başarıyla gönderdikten sonra, not defteri çıkışında Azure Machine Learning çalışma alanında deneme çalıştırmasına bir bağlantı görürsünüz. Azure Machine Learning'de otomatik çalıştırmanızı izlemek için bağlantıyı seçin.

Bağlantının vurgulandığı Azure Synapse Analytics'in ekran görüntüsü.

Sonraki adımlar