Çalışma alanı paketleri
Çalışma alanı paketleri özel veya özel tekerlek (Python), jar (Scala/Java) veya tar.gz (R) dosyaları olabilir. Bu paketleri çalışma alanınıza yükleyebilir ve daha sonra belirli bir Spark havuzuna atayabilirsiniz.
Çalışma alanı paketleri eklemek için:
- Çalışma Alanı paketleriniyönet> sekmesine gidin.
- Dosya seçiciyi kullanarak tekerlek dosyalarınızı karşıya yükleyin.
- Dosyalar Azure Synapse çalışma alanına yüklendikten sonra bu paketleri belirli bir Apache Spark havuzuna ekleyebilirsiniz.
Uyarı
Azure Synapse içinde Apache Spark havuzu, Çalışma Alanı Paketleri olarak karşıya yüklenen veya iyi bilinen bir Azure Data Lake Storage yoluna yüklenen özel kitaplıklardan yararlanabilir. Ancak, bu seçeneklerin her ikisi de aynı Apache Spark havuzunda aynı anda kullanılamaz. Paketler her iki yöntem kullanılarak sağlanıyorsa, yalnızca Çalışma Alanı paketleri listesinde belirtilen tekerlek dosyaları yüklenir.
Çalışma Alanı Paketleri belirli bir Apache Spark havuzuna paketleri yüklemek için kullanıldığında, aynı havuzdaki Depolama hesabı yolunu kullanarak paketleri artık belirtemezsiniz.
Not
Çalışma alanında aynı ada sahip birden çok tekerlek paketine sahip olmanız önerilmez. Aynı tekerlek paketinin farklı bir sürümünü kullanmak istiyorsanız mevcut sürümü silmeniz ve yeni sürümü karşıya yüklemeniz gerekir.
Depolama hesabı
Özel olarak oluşturulmuş tekerlek paketleri, tüm tekerlek dosyaları Synapse çalışma alanıyla bağlantılı Azure Data Lake Storage (2. Nesil) hesabına yüklenerek Apache Spark havuzuna yüklenebilir.
Dosyalar depolama hesabının varsayılan kapsayıcısında aşağıdaki yola yüklenmelidir:
abfss://<file_system>@<account_name>.dfs.core.windows.net/synapse/workspaces/<workspace_name>/sparkpools/<pool_name>/libraries/python/
Uyarı
- Bazı durumlarda, dosya yolu zaten yoksa yukarıdaki yapıya göre oluşturmanız gerekebilir. Örneğin, henüz yoksa klasörü klasörün içine
libraries
eklemenizpython
gerekebilir. - Özel tekerlek dosyalarını yönetmeye yönelik bu yöntem Apache Spark 3.0 için Azure Synapse Çalışma Zamanı'nda desteklenmez. Özel tekerlek dosyalarını yönetmek için lütfen Çalışma alanı paketleri özelliğine bakın.
Önemli
Azure DataLake Depolama yöntemini kullanarak özel kitaplıkları yüklemek için, Azure Synapse Analytics çalışma alanına bağlı birincil 2. Nesil Depolama hesabında Depolama Blob Verileri Katkıda Bulunanı veya Depolama Blob Verileri Sahibi izinlerine sahip olmanız gerekir.
Sonraki adımlar
- Varsayılan kitaplıkları görüntüleme: Apache Spark sürüm desteği
- Kitaplık yükleme hatalarını giderme: Kitaplık hatalarını giderme
- Azure Data Lake Storage Hesabınızı kullanarak özel conda kanalı oluşturma: Conda özel kanalları