Hızlı Başlangıç: Synapse Studio kullanarak sunucusuz Apache Spark havuzu oluşturma
Azure Synapse Analytics, verilerinizi alma, dönüştürme, modelleme, analiz etme ve sunmanıza yardımcı olan çeşitli analiz altyapıları sunar. Apache Spark havuzu açık kaynak büyük veri işlem özellikleri sunar. Synapse çalışma alanınızda bir Apache Spark havuzu oluşturduktan sonra, içgörü elde etmek için veriler yüklenebilir, modellenebilir, işlenebilir ve sunulur.
Bu hızlı başlangıçta Synapse Studio kullanarak Synapse çalışma alanında Apache Spark havuzu oluşturma adımları açıklanmaktadır.
Önemli
Spark örnekleri için faturalama, kullansanız da kullanmasanız da dakikada bir eşit olarak dağıtılır. Spark örneğinizi kullanmayı tamamladıktan sonra kapatdığınızdan veya kısa bir zaman aşımı ayarladığınızdan emin olun. Daha fazla bilgi için bu makalenin Kaynakları temizleme bölümüne bakın.
Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.
Önkoşullar
- Bir Azure aboneliğine sahip olmanız gerekir. Gerekirse ücretsiz bir Azure hesabı oluşturun
- Synapse çalışma alanını kullanacaksınız.
Azure portalda oturum açma
Azure portalda oturum açma
Synapse çalışma alanına gidin
Arama çubuğuna hizmet adını (veya kaynak adını doğrudan) yazarak Apache Spark havuzunun oluşturulacağı Synapse çalışma alanına gidin.
Çalışma alanları listesinden, açılacak çalışma alanının adını (veya adının bir bölümünü) yazın. Bu örnekte contosoanalytics adlı bir çalışma alanı kullanıyoruz.
Synapse Studio'yu başlatma
Çalışma alanına genel bakış sayfasında Çalışma Alanı web URL'sini seçerek Synapse Studio'yu açın.
Synapse Studio'da Apache Spark havuzu oluşturma
Önemli
Apache Spark 2.4 için Azure Synapse Runtime kullanım dışı bırakıldı ve Eylül 2023'ten bu yana resmi olarak desteklenmiyor. Spark 3.1 ve Spark 3.2 de Destek Sonu duyurulduğunda müşterilerin Spark 3.3'e geçmelerini öneririz.
Synapse Studio giriş sayfasında Yönet simgesini seçerek sol gezinti bölmesinde Yönetim Merkezi'ne gidin.
Yönetim Hub'ına girdikten sonra Apache Spark havuzları bölümüne gidip çalışma alanında kullanılabilen Apache Spark havuzlarının geçerli listesini görün.
+ Yeni'yi seçtiğinizde yeni Apache Spark havuzu oluşturma sihirbazı görüntülenir.
Temel Bilgiler sekmesine aşağıdaki ayrıntıları girin:
Ayar Önerilen değer Açıklama Apache Spark havuzu adı Geçerli bir havuz adı, örneğin contosospark
Bu, Apache Spark havuzunun sahip olacağı addır. Düğüm boyutu Küçük (4 vCPU / 32 GB) Bu hızlı başlangıcın maliyetlerini azaltmak için bunu en küçük boyuta ayarlayın Otomatik Ölçeklendirme Devre dışı Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacak Düğüm sayısı 8 Bu hızlı başlangıçta maliyetleri sınırlamak için küçük bir boyut kullanın Yürütücüleri dinamik olarak ayırma Devre dışı Bu ayar, Spark Uygulaması yürütücüleri ayırması için Spark yapılandırmasındaki dinamik ayırma özelliğine eşler. Bu hızlı başlangıçta otomatik ölçeklendirmeye ihtiyacımız olmayacaktır. Önemli
Apache Spark havuzlarının kullanabileceği adlar için belirli sınırlamalar vardır. Adlar yalnızca harf veya sayı içermelidir, 15 veya daha az karakter uzunluğunda olmalı, bir harfle başlamalıdır, ayrılmış sözcükler içermemelidir ve çalışma alanında benzersiz olmalıdır.
Sonraki sekme olan Ek ayarlar'da tüm ayarları varsayılan olarak bırakın.
Etiketler'i seçin. Azure etiketlerini kullanmayı göz önünde bulundurun. Örneğin, kaynağı kimin oluşturduğunu belirlemek için "Sahip" veya "CreatedBy" etiketi ve bu kaynağın Üretim, Geliştirme vb. içinde olup olmadığını belirlemek için "Ortam" etiketi. Daha fazla bilgi için bkz . Azure kaynakları için adlandırma ve etiketleme stratejinizi geliştirme. Hazır olduğunuzda Gözden Geçir ve oluştur'u seçin.
Gözden Geçir + oluştur sekmesinde, daha önce girilenlere göre ayrıntıların doğru göründüğünden emin olun ve Oluştur'a basın.
Apache Spark havuzu sağlama işlemini başlatır.
Sağlama tamamlandıktan sonra yeni Apache Spark havuzu listede görünür.
Synapse Studio kullanarak Apache Spark havuzu kaynaklarını temizleme
Aşağıdaki adımlar Synapse Studio kullanarak Apache Spark havuzunu çalışma alanından siler.
Uyarı
Spark havuzunun silinmesi analiz altyapısını çalışma alanından kaldırır. Artık havuza bağlanmak mümkün olmayacak ve bu Spark havuzunu kullanan tüm sorgular, işlem hatları ve not defterleri artık çalışmayacaktır.
Apache Spark havuzunu silmek istiyorsanız aşağıdaki adımları uygulayın:
Synapse Studio'daki Yönetim Hub'ında Apache Spark havuzlarına gidin.
Apache Spark havuzu komutlarını göstermek için silinecek Apache havuzunun yanındaki üç noktayı (bu örnekte contosospark) seçin.
Sil'i seçin.
Silme işlemini onaylayın ve Sil düğmesine basın.
İşlem başarıyla tamamlandığında Apache Spark havuzu artık çalışma alanı kaynaklarında listelenmez.