Bir kaynak veri deposundan hedef veri deposuna artımlı olarak veri yükleme

UYGULANANLAR: Azure Data Factory Azure Synapse Analytics

İpucu

Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!

İlk veriler yüklendikten sonra verileri artımlı olarak (veya delta) yükleme senaryosu, veri tümleştirme çözümlerinde sıkça kullanılır. Bu bölümdeki öğreticiler, Azure Data Factory kullanarak artımlı veri yüklemenin farklı yollarını gösterir.

Filigran kullanarak veritabanından delta veri yükleme

Bu durumda, kaynak veritabanında bir filigran tanımlayın. Filigran, en son güncelleştirilen zaman damgası veya artan bir anahtarı olan bir sütundur. Delta yükleme çözümü, eski bir filigran ile yeni bir filigran arasında değiştirilen verileri yükler. Bu yaklaşıma yönelik iş akışı şu diyagramda gösterilmiştir:

Filigran kullanmaya yönelik iş akışı

Adım adım yönergeler için şu öğreticilere bakın:

Şablonlar için aşağıdakilere bakın:

Değişiklik İzleme teknolojisini kullanarak SQL DB'den delta veri yükleme

Değişiklik İzleme teknolojisi, SQL Server ve Azure SQL Veritabanı’nda bulunan, uygulamalar için verimli bir değişiklik izleme mekanizması sağlayan basit bir çözümdür. Bir uygulamanın eklenen, güncelleştirilen veya silinen verileri kolayca tanımlamasına olanak sağlar.

Bu yaklaşıma yönelik iş akışı şu diyagramda gösterilmiştir:

Değişiklik İzleme kullanmaya yönelik iş akışı

Adım adım yönergeler için aşağıdaki öğreticiye bakın:

Yeni ve değiştirilmiş dosyaları yalnızca LastModifiedDate kullanarak yükleme

Yeni ve değiştirilmiş dosyaları yalnızca LastModifiedDate kullanarak hedef depoya kopyalayabilirsiniz. ADF kaynak depodaki tüm dosyaları tarar, dosya filtresini LastModifiedDate ölçütüne göre uygular ve yalnızca yeni ve güncelleştirilmiş dosyayı hedef depoya son kez kopyalar. ADF'nin çok miktarda dosyayı taramasına izin verirseniz ancak hedefe yalnızca birkaç dosya kopyalarsanız, dosya tarama işlemi nedeniyle bu işlemin yine de uzun süreceğini unutmayın.

Adım adım yönergeler için aşağıdaki öğreticiye bakın:

Şablonlar için aşağıdakilere bakın:

Yeni dosyaları yalnızca zaman bölümlenmiş klasör veya dosya adı kullanarak yükleme.

Dosya veya klasör adının (örneğin, /y/aa/gg/file.csv) parçası olarak dosya veya klasörlerin zaman dilimi bilgileriyle bölümlenmiş olduğu yeni dosyaları yalnızca kopyalayabilirsiniz. Bu, yeni dosyaları artımlı olarak yüklemek için en yüksek performanslı yaklaşımdır.

Adım adım yönergeler için aşağıdaki öğreticiye bakın:

Şu öğreticiye ilerleyin: