Azure Data Factory veya Synapse Analytics kullanarak PostgreSQL'den veri kopyalama
UYGULANANLAR: Azure Data Factory Azure Synapse Analytics
İpucu
Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!
Bu makalede, PostgreSQL veritabanından veri kopyalamak için Azure Data Factory ve Synapse Analytics işlem hatlarında Kopyalama Etkinliğinin nasıl kullanılacağı özetlenmiştir. Kopyalama etkinliğine genel bir genel bakış sunan kopyalama etkinliğine genel bakış makalesini oluşturur.
Önemli
Yeni PostgreSQL bağlayıcısı geliştirilmiş yerel PostgreSQL desteği sağlar. Çözümünüzde eski PostgreSQL bağlayıcısını kullanıyorsanız lütfen PostgreSQL bağlayıcınızı 31 Ekim 2024'e kadar yükseltin. Eski ve en son sürüm arasındaki fark hakkında ayrıntılı bilgi için bu bölüme bakın.
Desteklenen özellikler
Bu PostgreSQL bağlayıcısı aşağıdaki özellikler için desteklenir:
Desteklenen özellikler | IR |
---|---|
Kopyalama etkinliği (kaynak/-) | (1) (2) |
Arama etkinliği | (1) (2) |
(1) Azure tümleştirme çalışma zamanı (2) Şirket içinde barındırılan tümleştirme çalışma zamanı
Kopyalama etkinliği tarafından kaynak/havuz olarak desteklenen veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.
Özellikle, bu PostgreSQL bağlayıcısı PostgreSQL sürüm 7.4 ve üzerini destekler.
Önkoşullar
Veri deponuz bir şirket içi ağ, Azure sanal ağı veya Amazon Sanal Özel Bulut içinde bulunuyorsa, şirket içinde barındırılan tümleştirme çalışma zamanını buna bağlanmak için yapılandırmanız gerekir.
Veri deponuz yönetilen bir bulut veri hizmetiyse Azure Integration Runtime'ı kullanabilirsiniz. Erişim, güvenlik duvarı kurallarında onaylanan IP'ler ile sınırlıysa Azure Integration Runtime IP'lerini izin verme listesine ekleyebilirsiniz.
Şirket içinde barındırılan tümleştirme çalışma zamanı yüklemeden ve yapılandırmadan şirket içi ağa erişmek için Azure Data Factory'deki yönetilen sanal ağ tümleştirme çalışma zamanı özelliğini de kullanabilirsiniz.
Data Factory tarafından desteklenen ağ güvenlik mekanizmaları ve seçenekleri hakkında daha fazla bilgi için bkz . Veri erişim stratejileri.
Integration Runtime, 3.7 sürümünden itibaren yerleşik bir PostgreSQL sürücüsü sağlar, bu nedenle herhangi bir sürücüyü el ile yüklemeniz gerekmez.
Başlarken
İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:
- Veri Kopyalama aracı
- Azure portal
- .NET SDK'sı
- Python SDK'sı
- Azure PowerShell
- The REST API
- Azure Resource Manager şablonu
Kullanıcı arabirimini kullanarak PostgreSQL'e bağlı hizmet oluşturma
Azure portalı kullanıcı arabiriminde PostgreSQL'e bağlı bir hizmet oluşturmak için aşağıdaki adımları kullanın.
Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:
Postgre'yi arayın ve PostgreSQL bağlayıcısını seçin.
Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.
Bağlayıcı yapılandırma ayrıntıları
Aşağıdaki bölümlerde, PostgreSQL bağlayıcısına özgü Data Factory varlıklarını tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.
Bağlı hizmet özellikleri
PostgreSQL bağlı hizmeti için aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Tür özelliği şu şekilde ayarlanmalıdır: PostgreSqlV2 | Yes |
sunucu | PostgreSQL'in çalıştığı ana bilgisayar adını (ve isteğe bağlı olarak bağlantı noktasını) belirtir. | Yes |
port | PostgreSQL sunucusunun TCP bağlantı noktası. | Hayır |
database | Bağlanacak PostgreSQL veritabanı. | Yes |
username | Bağlanacak kullanıcı adı. IntegratedSecurity kullanılıyorsa gerekli değildir. | Yes |
password | Bağlanacak parola. IntegratedSecurity kullanılıyorsa gerekli değildir. | Yes |
sslMode | Sunucu desteğine bağlı olarak SSL kullanılıp kullanılmayacağını denetler. - Devre dışı bırak: SSL devre dışı bırakıldı. Sunucu SSL gerektiriyorsa bağlantı başarısız olur. - İzin Ver: Sunucu izin veriyorsa SSL olmayan bağlantıları tercih edin, ancak SSL bağlantılarına izin verin. - Tercih: Sunucu izin veriyorsa SSL bağlantılarını tercih edin, ancak SSL olmadan bağlantılara izin verin. - Gerekli: Sunucu SSL'yi desteklemiyorsa bağlantı başarısız olur. - Verify-ca: Sunucu SSL'yi desteklemiyorsa bağlantıyı başarısız yapın. Ayrıca sunucu sertifikayı da doğrular. - Tam doğrulama: Sunucu SSL'yi desteklemiyorsa bağlantıyı başarısız yapın. Ayrıca sunucu sertifikasını ana bilgisayar adıyla doğrular. Seçenekler: Devre Dışı Bırak (0) / İzin Ver (1) / Tercih Et (2) (Varsayılan) / Gerekli (3) / Verify-ca (4) / Verify-full (5) |
Hayır |
authenticationType | Veritabanına bağlanmak için kimlik doğrulama türü. Yalnızca Temel'i destekler. | Yes |
connectVia | Veri deposuna bağlanmak için kullanılacak Integration Runtime. Önkoşullar bölümünden daha fazla bilgi edinin. Belirtilmezse, varsayılan Azure Integration Runtime'ı kullanır. | Hayır |
Ek bağlantı özellikleri: | ||
schema | Şema arama yolunu ayarlar. | Hayır |
Havuzu | Bağlantı havuzu kullanılması gerekip gerekmediği. | Hayır |
connectionTimeout | Denemeyi sonlandırmadan ve hata oluşturmadan önce bağlantı kurmaya çalışırken bekleme süresi (saniye cinsinden). | Hayır |
commandTimeout | Denemeyi sonlandırmadan ve hata oluşturmadan önce komutu yürütmeye çalışırken bekleme süresi (saniye cinsinden). Sonsuzluk için sıfır olarak ayarlayın. | Hayır |
trustServerCertificate | Sunucu sertifikasının doğrulanmadan güvenilip güvenmeyeceği. | Hayır |
sslCertificate | Sunucuya gönderilecek istemci sertifikasının konumu. | Hayır |
sslKey | Sunucuya gönderilecek bir istemci sertifikasının istemci anahtarının konumu. | Hayır |
sslPassword | İstemci sertifikası için anahtar parolası. | Hayır |
readBufferSize | Npgsql'in okurken kullandığı iç arabellek boyutunu belirler. Veritabanından büyük değerler aktarılırken artan performans iyileştirebilir. | Hayır |
logParameters | Etkinleştirildiğinde, komutlar yürütülürken parametre değerleri günlüğe kaydedilir. | Hayır |
timezone | Oturum saat dilimini alır veya ayarlar. | Hayır |
encoding | PostgreSQL dize verilerini kodlamak/kodunu çözmek için kullanılacak .NET kodlamasını alır veya ayarlar. | Hayır |
Not
Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nı kullanırken ODBC bağlantısı üzerinden tam SSL doğrulaması yapabilmek için PostgreSQL bağlayıcısı yerine bir ODBC türü bağlantısı kullanmanız ve aşağıdaki yapılandırmayı tamamlamanız gerekir:
- Herhangi bir SHIR sunucusunda DSN'yi ayarlayın.
- SHIR sunucularına C:\Windows\ServiceProfiles\DIAHostService\AppData\Roaming\postgresql\root.crt dizinine PostgreSQL için uygun sertifikayı yerleştirin. ODBC sürücüsünün veritabanına ne zaman bağlandığını doğrulamak için SSL sertifikasını arayacağı > yer burasıdır.
- Veri fabrikası bağlantınızda, bağlantı dizesi SHIR sunucularınızda oluşturduğunuz DSN'yi işaret eden bir ODBC türü bağlantısı kullanın.
Örnek:
{
"name": "PostgreSqlLinkedService",
"properties": {
"type": "PostgreSqlV2",
"typeProperties": {
"server": "<server>",
"port": 5432,
"database": "<database>",
"username": "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"sslmode": <sslmode>,
"authenticationType": "Basic"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Örnek: Azure Key Vault'ta parola depolama
{
"name": "PostgreSqlLinkedService",
"properties": {
"type": "PostgreSqlV2",
"typeProperties": {
"server": "<server>",
"port": 5432,
"database": "<database>",
"username": "<username>",
"password": {
"type": "AzureKeyVaultSecret",
"store": {
"referenceName": "<Azure Key Vault linked service name>",
"type": "LinkedServiceReference"
},
"secretName": "<secretName>"
}
"sslmode": <sslmode>,
"authenticationType": "Basic"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Veri kümesi özellikleri
Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için veri kümeleri makalesine bakın. Bu bölümde PostgreSQL veri kümesi tarafından desteklenen özelliklerin listesi sağlanır.
PostgreSQL'den veri kopyalamak için aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Veri kümesinin tür özelliği şu şekilde ayarlanmalıdır: PostgreSqlV2Table | Yes |
schema | Şemanın adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
table | Tablonun adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
Örnek
{
"name": "PostgreSQLDataset",
"properties":
{
"type": "PostgreSqlV2Table",
"linkedServiceName": {
"referenceName": "<PostgreSQL linked service name>",
"type": "LinkedServiceReference"
},
"annotations": [],
"schema": [],
"typeProperties": {
"schema": "<schema name>",
"table": "<table name>"
}
}
}
Yazılan veri kümesini kullanıyorsanız RelationalTable
, bu veri kümesi olduğu gibi desteklenmeye devam ederken, ileriye dönük yeni bir veri kümesini kullanmanız önerilir.
Kopyalama etkinliğinin özellikleri
Etkinlikleri tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için İşlem hatları makalesine bakın. Bu bölümde PostgreSQL kaynağı tarafından desteklenen özelliklerin listesi sağlanır.
Kaynak olarak PostgreSQL
PostgreSQL'den veri kopyalamak için kopyalama etkinliği kaynağı bölümünde aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Kopyalama etkinliği kaynağının type özelliği şu şekilde ayarlanmalıdır: PostgreSqlV2Source | Yes |
query | Verileri okumak için özel SQL sorgusunu kullanın. Örneğin: "query": "SELECT * FROM \"MySchema\".\"MyTable\"" . |
Hayır (veri kümesinde "tableName" belirtilirse) |
Not
Şema ve tablo adları büyük/küçük harfe duyarlıdır. Bunları sorguda ""
(çift tırnak) içine alın.
Örnek:
"activities":[
{
"name": "CopyFromPostgreSQL",
"type": "Copy",
"inputs": [
{
"referenceName": "<PostgreSQL input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "PostgreSqlV2Source",
"query": "SELECT * FROM \"MySchema\".\"MyTable\""
},
"sink": {
"type": "<sink type>"
}
}
}
]
Yazılan kaynağı kullanıyorsanız RelationalSource
, yine de olduğu gibi desteklenir, ancak bundan sonra yenisini kullanmanız önerilir.
PostgreSQL için veri türü eşlemesi
PostgreSQL'den veri kopyalarken, aşağıdaki eşlemeler PostgreSQL veri türlerinden hizmet tarafından dahili olarak kullanılan ara veri türlerine kullanılır. Kopyalama etkinliğinin kaynak şemayı ve veri türünü havuza nasıl eşlediğini öğrenmek için bkz . Şema ve veri türü eşlemeleri .
PostgreSql veri türü | Ara hizmet veri türü | PostgreSQL için ara hizmet veri türü (eski) |
---|---|---|
SmallInt |
Int16 |
Int16 |
Integer |
Int32 |
Int32 |
BigInt |
Int64 |
Int64 |
Decimal (Duyarlık <= 28) |
Decimal |
Decimal |
Decimal (Duyarlık > 28) |
Desteklenmeyen | String |
Numeric |
Decimal |
Decimal |
Real |
Single |
Single |
Double |
Double |
Double |
SmallSerial |
Int16 |
Int16 |
Serial |
Int32 |
Int32 |
BigSerial |
Int64 |
Int64 |
Money |
Decimal |
String |
Char |
String |
String |
Varchar |
String |
String |
Text |
String |
String |
Bytea |
Byte[] |
Byte[] |
Timestamp |
DateTime |
DateTime |
Timestamp with time zone |
DateTime |
String |
Date |
DateTime |
DateTime |
Time |
TimeSpan |
TimeSpan |
Time with time zone |
DateTimeOffset |
String |
Interval |
TimeSpan |
String |
Boolean |
Boolean |
Boolean |
Point |
String |
String |
Line |
String |
String |
Iseg |
String |
String |
Box |
String |
String |
Path |
String |
String |
Polygon |
String |
String |
Circle |
String |
String |
Cidr |
String |
String |
Inet |
String |
String |
Macaddr |
String |
String |
Macaddr8 |
String |
String |
Tsvector |
String |
String |
Tsquery |
String |
String |
UUID |
Guid |
Guid |
Json |
String |
String |
Jsonb |
String |
String |
Array |
String |
String |
Bit |
Byte[] |
Byte[] |
Bit varying |
Byte[] |
Byte[] |
XML |
String |
String |
IntArray |
String |
String |
TextArray |
String |
String |
NumbericArray |
String |
String |
DateArray |
String |
String |
Range |
String |
String |
Bpchar |
String |
String |
Arama etkinliği özellikleri
Özellikler hakkında ayrıntılı bilgi edinmek için Arama etkinliği'ne bakın.
PostgreSQL bağlı hizmetini yükseltme
PostgreSQL bağlı hizmetinizi yükseltmenize yardımcı olan adımlar şunlardır:
Yeni bir PostgreSQL bağlı hizmeti oluşturun ve Bağlı hizmet özelliklerine başvurarak bunu yapılandırın.
En son PostgreSQL bağlı hizmeti için veri türü eşlemesi, eski sürümden farklıdır. En son veri türü eşlemesini öğrenmek için bkz . PostgreSQL için veri türü eşlemesi.
PostgreSQL ile PostgreSQL arasındaki farklar (eski)
Aşağıdaki tabloda PostgreSQL ile PostgreSQL (eski) arasındaki veri türü eşleme farkları gösterilmektedir.
PostgreSQL veri türü | PostgreSQL için ara hizmet veri türü | PostgreSQL için ara hizmet veri türü (eski) |
---|---|---|
Money | Ondalık | String |
Saat dilimi ile zaman damgası | DateTime | String |
Saat dilimi olan saat | DateTimeOffset | String |
Aralık | TimeSpan | String |
BigDecimal | Desteklenmiyor. Alternatif olarak, BigDecimal'i String'e dönüştürmek için işlevini kullanın to_char() . |
String |
İlgili içerik
Kopyalama etkinliği tarafından kaynak ve havuz olarak desteklenen veri depolarının listesi için bkz . desteklenen veri depoları.