Azure Data Factory şablonunu kullanarak veritabanından Azure Veri Gezgini toplu kopyalama
Azure Veri Gezgini hızlı, tam olarak yönetilen bir veri analizi hizmetidir. Uygulamalar, web siteleri ve IoT cihazları gibi birçok kaynaktan akışla aktaran büyük hacimli veriler üzerinde gerçek zamanlı analiz sunar.
Oracle Server, Netezza, Teradata veya SQL Server'daki bir veritabanından Azure Veri Gezgini'a veri kopyalamak için birden çok tablodan çok miktarda veri yüklemeniz gerekir. Genellikle, tek bir tablodan paralel olarak birden çok iş parçacığına sahip satırları yükleyebilmeniz için verilerin her tabloda bölümlenmiş olması gerekir. Bu makalede, bu senaryolarda kullanılacak bir şablon açıklanmaktadır.
Azure Data Factory şablonları önceden tanımlanmış Data Factory işlem hatlarıdır. Bu şablonlar Data Factory ile hızlı bir şekilde çalışmaya başlamanıza ve veri tümleştirme projelerinde geliştirme süresini azaltmanıza yardımcı olabilir.
Lookup ve ForEach etkinliklerini kullanarak Veritabanından Azure'a Toplu Kopyalama Veri Gezgini şablonunu oluşturursunuz. Daha hızlı veri kopyalama için şablonu kullanarak veritabanı veya tablo başına çok sayıda işlem hattı oluşturabilirsiniz.
Önemli
Kopyalamak istediğiniz veri miktarına uygun aracı kullandığınızdan emin olun.
- SQL server ve Google BigQuery gibi veritabanlarındaki büyük miktarda veriyi Azure Veri Gezgini kopyalamak için Veritabanından Azure'a Toplu Kopyalama Veri Gezgini şablonunu kullanın.
- Küçük veya orta miktarda veri içeren birkaç tabloyu Azure Veri Gezgini kopyalamak için Data Factory Veri Kopyalama aracını kullanın.
Önkoşullar
- Azure aboneliği. Ücretsiz bir Azure hesabı oluşturun.
- Azure Veri Gezgini kümesi ve veritabanı. Küme ve veritabanı oluşturma.
- Bir veri fabrikası. Veri fabrikası oluşturma.
- Veri kaynağı.
ControlTableDataset Oluşturma
ControlTableDataset , kaynaktan işlem hattındaki hedefe kopyalanacak verileri gösterir. Satır sayısı, verileri kopyalamak için gereken toplam işlem hattı sayısını gösterir. ControlTableDataset'i kaynak veritabanının bir parçası olarak tanımlamanız gerekir.
Aşağıdaki kodda SQL Server kaynak tablo biçimine bir örnek gösterilmiştir:
CREATE TABLE control_table (
PartitionId int,
SourceQuery varchar(255),
ADXTableName varchar(255)
);
Kod öğeleri aşağıdaki tabloda açıklanmıştır:
Özellik | Açıklama | Örnek |
---|---|---|
PartitionId | Kopyalama sırası | 1 |
SourceQuery | İşlem hattı çalışma zamanı sırasında hangi verilerin kopyalandığını gösteren sorgu | select * from table where lastmodifiedtime LastModifytime >= ''2015-01-01 00:00:00''> |
ADXTableName | Hedef tablo adı | MyAdxTable |
ControlTableDataset'iniz farklı bir biçimdeyse, biçiminiz için benzer bir ControlTableDataset oluşturun.
Veritabanından Azure'a Toplu Kopyalama Veri Gezgini şablonunu kullanma
Başlayalım bölmesinde Şablondan işlem hattı oluştur'u seçerek Şablon galerisi bölmesini açın.
Veritabanından Azure'a Toplu Kopyalama Veri Gezgini şablonunu seçin.
Veritabanından Azure'a Toplu Kopyalama Veri Gezgini bölmesinde, Kullanıcı Girişleri'nin altında aşağıdakileri yaparak veri kümelerinizi belirtin:
a. ControlTableDataset açılan listesinde, hangi verilerin kaynaktan hedefe kopyalandığını ve hedefe nereye yerleştirileceğini gösteren denetim tablosuna bağlı hizmeti seçin.
b. SourceDataset açılan listesinde kaynak veritabanına bağlı hizmeti seçin.
c. AzureDataExplorerTable açılan listesinde Azure Veri Gezgini tablosunu seçin. Veri kümesi yoksa, veri kümesini eklemek için Azure Veri Gezgini bağlı hizmetini oluşturun.
d. Bu şablonu kullan'ı seçin.
Şablon işlem hattına erişmek için tuvalde etkinliklerin dışında bir alan seçin. Ad (denetim tablosu adı) ve Varsayılan değer (sütun adları) dahil olmak üzere tablonun parametrelerini girmek için Parametreler sekmesini seçin.
Arama'nın altında GetPartitionList'i seçerek varsayılan ayarları görüntüleyin. Sorgu otomatik olarak oluşturulur.
ForEachPartition Komut etkinliğini seçin, Ayarlar sekmesini seçin ve ardından aşağıdakileri yapın:
a. Toplu iş sayısı kutusuna 1 ile 50 arasından bir sayı girin. Bu seçim, ControlTableDataset satır sayısına ulaşılana kadar paralel olarak çalışan işlem hatlarının sayısını belirler.
b. İşlem hattı toplu işlemlerinin paralel çalıştığından emin olmak için Sıralı onay kutusunu seçmeyin.
İpucu
En iyi yöntem, verilerinizin daha hızlı kopyalanması için birçok işlem hattını paralel çalıştırmaktır. Verimliliği artırmak için kaynak tablodaki verileri bölümleyip tarih ve tabloya göre işlem hattı başına bir bölüm ayırın.
Azure Data Factory işlem hattını doğrulamak için Tümünü Doğrula'yı seçin ve ardından sonucu İşlem Hattı Doğrulama Çıktısı bölmesinde görüntüleyin.
Gerekirse Hata Ayıkla'yı ve ardından tetikleyici ekle'yi seçerek işlem hattını çalıştırın.
Artık veritabanlarınızdan ve tablolarınızdan büyük miktarda veriyi verimli bir şekilde kopyalamak için şablonu kullanabilirsiniz.
İlgili içerik
- Azure Data Factory için Azure Veri Gezgini bağlayıcısı hakkında bilgi edinin.
- Data Factory kullanıcı arabiriminde bağlı hizmetleri, veri kümelerini ve işlem hatlarını düzenleyin.
- Azure Veri Gezgini web kullanıcı arabirimindeki verileri sorgulama.