Delta Lake tablosuna yükleme
Microsoft Fabric'teki Lakehouse, analiz için hazır iyileştirilmiş bir Delta tablosuna ortak dosya türlerini verimli bir şekilde yükleme özelliği sağlar. Tabloya Yükle özelliği, kullanıcıların tabloya tek bir dosya veya dosya klasörü yüklemesine olanak tanır. Bu özellik, dosya ve klasörlere tablo yüklemeyi etkinleştirmek için sağ tıklama eylemini hızla kullanmalarına olanak tanıyarak veri mühendislerinin üretkenliğini artırır. Tabloya yükleme de kod içermeyen bir deneyimdir ve bu da tüm kişilikler için giriş çubuğunu düşürür.
Tabloya Yükleme özelliklerine genel bakış
Kullanıcılarımıza üretkenliklerini artırırken esneklik sağlamak için tümleşik tabloya yükleme deneyiminde etkinleştirdiğimiz özelliklerin listesi aşağıdadır:
Desteklenen dosya türleri: Bu özellik şu anda yalnızca PARQUET veya CSV dosya türlerini yüklemeyi destekler. Dosya uzantısı olayı önemli değildir.
Tek dosyalı yükleme: Kullanıcılar, dosyanın bağlam menüsü eyleminde "Delta Tablosuna Yükle" seçeneğini belirleyerek desteklenen biçimlerden birinde kendi seçtikleri tek bir dosyayı yükleyebilir.
Klasör düzeyinde yükleme: Klasöre tıkladıktan sonra "Delta Tablosuna Yükle" seçeneğini belirleyerek bir klasör ve alt klasörlerinin altındaki tüm dosyaları aynı anda yükleyebilirsiniz. Bu özellik tüm dosyaları otomatik olarak geçirip delta tablosuna yükler. Tabloya yalnızca aynı türde dosyaların aynı anda yüklenebileceğini unutmayın.
Yeni ve var olan tabloya yükle: Kullanıcı, dosya ve klasörlerini yeni bir tabloya veya kendi seçtiği mevcut bir tabloya yüklemeyi seçebilir. Mevcut bir tabloya yüklemeyi tercih ederlerse, tablodaki verilerini ekleyebilir veya üzerine yazabilir.
CSV Kaynak dosyası seçeneği: CSV dosyaları için, kullanıcının kaynak dosyasında sütun adı olarak kullanmak istedikleri üst bilgileri içerip içermediğini belirtmesine izin veririz. Kullanıcılar, varsayılan virgül ayırıcısını yerinde geçersiz kılmak için tercih ettikleri bir ayırıcı da belirtebilir.
Delta Tabloları Olarak Yüklenir: Tablolar her zaman Delta Lake tablo biçimi kullanılarak yüklenir ve V-Order iyileştirmesi etkinleştirilir.
Not
Şu anda Lakehouse kullanıcı arabirimi aracılığıyla tablo şemasını belirtemezsiniz; bu amaçla bir not defteri kullanmanız gerekir.
Doğrulama yönergeleri ve kuralları
Aşağıdaki standart Tabloya yükle deneyimi için geçerlidir:
Tablo adları yalnızca alfasayısal karakterler ve alt çizgi içerebilir. Ayrıca, en fazla 256 karakter uzunluğunda, büyük veya küçük harf ve alt çizgi ()
_
olan tüm İngilizce harflere izin verir. Tire (-
) veya boşluk karakterine izin verilmez.Sütun üst bilgisi olmayan metin dosyaları, tablo sütun adları olarak standart
col#
gösterimiyle değiştirilir.Sütun adları İngilizce harf, büyük veya küçük harf, alt çizgi ()
_
ve UTF dilinde Çince gibi diğer dillerde bulunan karakterlerin uzunluğu 128 karaktere kadardır. Sütun adları, yükleme eylemi sırasında doğrulanır. Deltaya Yükle algoritması yasak değerlerin yerine alt çubuk ()_
kullanır. Doğrulama sırasında düzgün bir sütun adı elde edilemezse, yük eylemi başarısız olur.CSV dosyaları için ayırıcı boş olamaz, 8 karakterden uzun olamaz veya şu karakterlerden herhangi birini kullanamaz:
(
, ,[
)
, ,]
{
,}
, tek tırnak ('
), çift tırnak ("
) ve boşluk.