Hızlı Başlangıç: Synapse Studio kullanarak sunucusuz Apache Spark havuzu oluşturma

Azure Synapse Analytics, verilerinizi alma, dönüştürme, modelleme, analiz etme ve sunmanıza yardımcı olan çeşitli analiz altyapıları sunar. Apache Spark havuzu açık kaynak büyük veri işlem özellikleri sunar. Synapse çalışma alanınızda bir Apache Spark havuzu oluşturduktan sonra, içgörü elde etmek için veriler yüklenebilir, modellenebilir, işlenebilir ve sunulur.

Bu hızlı başlangıçta Synapse Studio kullanarak Synapse çalışma alanında Apache Spark havuzu oluşturma adımları açıklanmaktadır.

Önemli

Spark örnekleri için faturalama, kullansanız da kullanmasanız da dakikada bir eşit olarak dağıtılır. Spark örneğinizi kullanmayı tamamladıktan sonra kapatdığınızdan veya kısa bir zaman aşımı ayarladığınızdan emin olun. Daha fazla bilgi için bu makalenin Kaynakları temizleme bölümüne bakın.

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Önkoşullar

Azure portalda oturum açma

Azure portalda oturum açma

  1. Arama çubuğuna hizmet adını (veya kaynak adını doğrudan) yazarak Apache Spark havuzunun oluşturulacağı Synapse çalışma alanına gidin. Screenshot from the Azure portal of the search bar with Synapse workspaces typed in.

  2. Çalışma alanları listesinden, açılacak çalışma alanının adını (veya adının bir bölümünü) yazın. Bu örnekte contosoanalytics adlı bir çalışma alanı kullanıyoruz. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Synapse Studio'yu başlatma

Çalışma alanına genel bakış sayfasında Çalışma Alanı web URL'sini seçerek Synapse Studio'yu açın.

Screenshot from the Azure portal of a Synapse workspace overview with Launch Synapse Studio highlighted.

Synapse Studio'da Apache Spark havuzu oluşturma

Önemli

Apache Spark 2.4 için Azure Synapse Runtime kullanım dışı bırakıldı ve Eylül 2023'ten bu yana resmi olarak desteklenmiyor. Spark 3.1 ve Spark 3.2 de Destek Sonu duyurulduğunda müşterilerin Spark 3.3'e geçmelerini öneririz.

  1. Synapse Studio giriş sayfasında Yönet simgesini seçerek sol gezinti bölmesinde Yönetim Merkezi'ne gidin. Screenshot from the Azure portal of the Synapse Studio home page with Management Hub section highlighted.

  2. Yönetim Hub'ına girdikten sonra Apache Spark havuzları bölümüne gidip çalışma alanında kullanılabilen Apache Spark havuzlarının geçerli listesini görün. Screenshot from the Azure portal of the Synapse Studio management hub with Apache Spark pools navigation selected.

  3. + Yeni'yi seçtiğinizde yeni Apache Spark havuzu oluşturma sihirbazı görüntülenir.

  4. Temel Bilgiler sekmesine aşağıdaki ayrıntıları girin:

    Ayar Önerilen değer Açıklama
    Apache Spark havuzu adı Geçerli bir havuz adı, örneğin contosospark Bu, Apache Spark havuzunun sahip olacağı addır.
    Düğüm boyutu Küçük (4 vCPU / 32 GB) Bu hızlı başlangıcın maliyetlerini azaltmak için bunu en küçük boyuta ayarlayın
    Otomatik Ölçeklendirme Devre dışı Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacak
    Düğüm sayısı 8 Bu hızlı başlangıçta maliyetleri sınırlamak için küçük bir boyut kullanın
    Yürütücüleri dinamik olarak ayırma Devre dışı Bu ayar, Spark Uygulaması yürütücüleri ayırması için Spark yapılandırmasındaki dinamik ayırma özelliğine eşler. Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacaktır.

    Screenshot from the Azure portal of the Basics for Synapse Studio new Apache Spark pool.

    Önemli

    Apache Spark havuzlarının kullanabileceği adlar için belirli sınırlamalar vardır. Adlar yalnızca harf veya sayı içermelidir, 15 veya daha az karakter uzunluğunda olmalı, bir harfle başlamalıdır, ayrılmış sözcükler içermemelidir ve çalışma alanında benzersiz olmalıdır.

  5. Sonraki sekme olan Ek ayarlar'da tüm ayarları varsayılan olarak bırakın.

  6. Etiketler'i seçin. Azure etiketlerini kullanmayı göz önünde bulundurun. Örneğin, kaynağı kimin oluşturduğunu belirlemek için "Sahip" veya "CreatedBy" etiketi ve bu kaynağın Üretim, Geliştirme vb. içinde olup olmadığını belirlemek için "Ortam" etiketi. Daha fazla bilgi için bkz . Azure kaynakları için adlandırma ve etiketleme stratejinizi geliştirme. Hazır olduğunuzda Gözden Geçir ve oluştur'u seçin.

  7. Gözden Geçir + oluştur sekmesinde, daha önce girilenlere göre ayrıntıların doğru göründüğünden emin olun ve Oluştur'a basın.

    Screenshot from the Azure portal of the Create Synapse Studio new Apache Spark pool.

  8. Apache Spark havuzu sağlama işlemini başlatır.

  9. Sağlama tamamlandıktan sonra yeni Apache Spark havuzu listede görünür.

    Screenshot from the Azure portal of the Synapse Studio new Apache Spark pool list.

Synapse Studio kullanarak Apache Spark havuzu kaynaklarını temizleme

Aşağıdaki adımlar Synapse Studio kullanarak Apache Spark havuzunu çalışma alanından siler.

Uyarı

Spark havuzunun silinmesi analiz altyapısını çalışma alanından kaldırır. Artık havuza bağlanmak mümkün olmayacak ve bu Spark havuzunu kullanan tüm sorgular, işlem hatları ve not defterleri artık çalışmayacaktır.

Apache Spark havuzunu silmek istiyorsanız aşağıdaki adımları uygulayın:

  1. Synapse Studio'daki Yönetim Hub'ında Apache Spark havuzlarına gidin.

  2. Apache Spark havuzu komutlarını göstermek için silinecek Apache havuzunun yanındaki üç noktayı (bu örnekte contosospark) seçin.

    Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.

  3. Sil'i seçin.

  4. Silme işlemini onaylayın ve Sil düğmesine basın.

  5. İşlem başarıyla tamamlandığında Apache Spark havuzu artık çalışma alanı kaynaklarında listelenmez.