Microsoft Fabric'te Data Factory'de sınırlandırılmış metin biçimi

Bu makalede, Microsoft Fabric'teki Data Factory'nin veri işlem hattında sınırlandırılmış metin biçiminin nasıl yapılandırılır?

Desteklenen özellikler

Sınırlanmış metin biçimi, kaynak ve hedef olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.

Kategori Bağlayıcı/Etkinlik
Desteklenen bağlayıcı Amazon S3
Amazon S3 Uyumlu
Azure Blob Depolama
Azure Data Lake Storage Gen1
Azure Data Lake Storage 2. Nesil
Azure Dosyaları
Dosya sistemi
FTP
Google Cloud Storage
HTTP
Lakehouse Dosyaları
Oracle Cloud Storage
SFTP
Desteklenen etkinlik Kopyalama etkinliği (kaynak/hedef)
Arama etkinliği
GetMetadata etkinliği
Silme etkinliği

Kopyalama etkinliğinde sınırlandırılmış metin biçimi

Sınırlandırılmış metin biçimini yapılandırmak için, veri işlem hattı kopyalama etkinliğinin kaynağında veya hedefinde bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde Sınırlanmış Metin'i seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.

Dosya biçimi ayarlarını gösteren ekran görüntüsü.

Kaynak olarak sınırlandırılmış metin biçimi

Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

Kaynak dosya biçimi ayarlarını gösteren ekran görüntüsü.

  • Sıkıştırma türü: Sınırlandırılmış metin dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Açılan listede Yok, bzip2, gzip, deflate, ZipDeflate, TarGzip veya tar türü arasından seçim yapabilirsiniz.

    Sıkıştırma türü olarak ZipDeflate'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Zip dosyası adını klasör olarak koru seçeneği gösterilir.

    • Zip dosyası adını klasör olarak koru: Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir.
      • Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine <specified file path>/<folder named as source zip file>/yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırması açılmış dosyaları doğrudan adresine <specified file path>yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.

    Sıkıştırma türü olarak TarGzip/tar'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Sıkıştırma dosyası adını klasör olarak koru gösterilir.

    • Sıkıştırma dosyası adını klasör olarak koru: Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
      • Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine <specified file path>/<folder named as source compressed file>/yazar.
      • Bu kutunun işareti kaldırılırsa, hizmet sıkıştırılan dosyaları doğrudan öğesine <specified file path>yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.
  • Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En uygun veya en hızlı arasından seçim yapabilirsiniz.

    • En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
    • En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
  • Sütun sınırlayıcısı: Dosyadaki sütunları ayırmak için kullanılan karakterler. Varsayılan değer virgüldür (,).

  • Satır sınırlayıcısı: Dosyadaki satırları ayırmak için kullanılan karakteri belirtin. Yalnızca bir karaktere izin verilir. Varsayılan değer satır akışıdır \n.

  • Kodlama: Test dosyalarını okumak/yazmak için kullanılan kodlama türü. Varsayılan değer UTF-8'dir.

  • Kaçış karakteri: Tırnak içine alınmış bir değer içinde çıkış tırnak içine tek karakter. Varsayılan değer ters eğik çizgidir \. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun.

  • Tırnak karakteri: Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Varsayılan değer çift tırnaktır". Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir.

  • Üst bilgi olarak ilk satır: İlk satırın sütun adlarını içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. İzin verilen değerler seçilir ve seçilmemiştir (varsayılan). Üst bilgi olarak ilk satır seçilmediğinde, kullanıcı arabirimi veri önizlemesi ve arama etkinliği çıktısı sütun adlarını otomatik olarak Prop_{n} olarak oluşturur (0'dan başlayarak), kopyalama etkinliği kaynaktan hedefe açık eşleme gerektirir ve sütunları sıralı olarak (1'den başlayarak) bulur.

  • Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.

Kaynak sekmesindeki Gelişmiş ayarlar'ın altında, sınırlandırılmış metin biçimiyle ilgili diğer özellikler gösterilir.

Hedef olarak sınırlandırılmış metin biçimi

Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

Hedef dosya biçimi ayarlarını gösteren ekran görüntüsü.

  • Sıkıştırma türü: Sınırlandırılmış metin dosyalarını yazmak için kullanılan sıkıştırma codec bileşeni. Açılan listede Yok, bzip2, gzip, deflate, ZipDeflate, TarGzip veya tar türü arasından seçim yapabilirsiniz.

  • Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En uygun veya en hızlı arasından seçim yapabilirsiniz.

    • En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
    • En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
  • Sütun sınırlayıcısı: Dosyadaki sütunları ayırmak için kullanılan karakterler. Varsayılan değer virgüldür (,).

  • Satır sınırlayıcısı: Dosyadaki satırları ayırmak için kullanılan karakter. Yalnızca bir karaktere izin verilir. Varsayılan değer satır akışıdır \n.

  • Kodlama: Test dosyalarını yazmak için kullanılan kodlama türü. Varsayılan değer UTF-8'dir.

  • Kaçış karakteri: Tırnak içine alınmış bir değer içinde çıkış tırnak içine tek karakter. Varsayılan değer ters eğik çizgidir \. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun.

  • Tırnak karakteri: Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Varsayılan değer çift tırnaktır". Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir.

  • Üst bilgi olarak ilk satır: İlk satırın sütun adlarını içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. İzin verilen değerler seçilir ve seçilmemiştir (varsayılan). Üst bilgi olarak ilk satır seçilmediğinde, kullanıcı arabirimi veri önizlemesi ve arama etkinliği çıktısı sütun adlarını otomatik olarak Prop_{n} olarak oluşturur (0'dan başlayarak), kopyalama etkinliği kaynaktan hedefe açık eşleme gerektirir ve sütunları sıralı olarak (1'den başlayarak) bulur.

  • Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.

Hedef sekmesindeki Gelişmiş ayarlar'ın altında, sınırlandırılmış metin biçimiyle ilgili daha fazla özellik gösterilir.

  • Tüm metni alıntıla: Tüm değerleri tırnak içine alın.

  • Dosya uzantısı: Çıktı dosyalarını adlandırmak için kullanılan dosya uzantısı, örneğin, .csv, .txt.

  • Dosya başına en fazla satır: Bir klasöre veri yazarken, birden çok dosyaya yazmayı ve dosya başına en fazla satırı belirtmeyi seçebilirsiniz.

  • Dosya adı ön eki: Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir: <fileNamePrefix>_00000.<fileExtension>. Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir.

Tablo özeti

Kaynak olarak sınırlandırılmış metin

Sınırlandırılmış metin biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.

Ad Tarif Değer Gerekli JSON betik özelliği
 Dosya biçimi Kullanmak istediğiniz dosya biçimi. Sınırlandırılmış Metin Yes type (altında datasetSettings):
Sınırlandırılmış Metin
Sıkıştırma türü Sınırlandırılmış metin dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Aşağıdakilerden birini seçin:
Hiçbiri
bzip2
gzip
Deflate
ZipDeflate
TarGzip
tar
Hayır type (altında compression):

bzip2
gzip
Deflate
ZipDeflate
TarGzip
tar
Zip dosyası adını klasör olarak koru Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. Sıkıştırmayı ZipDeflate'ı seçtiğinizde geçerlidir. Seçili veya seçimi kaldır Hayır preserveZipFileNameAsFolder
(altında compressionProperties->type olarak ZipDeflateReadSettings)
Sıkıştırma dosyası adını klasör olarak koru Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. TarGzip/tar sıkıştırmayı seçtiğinizde geçerlidir. Seçili veya seçimi kaldır Hayır preserveCompressionFileNameAsFolder
(altında compressionProperties->type veya )TarReadSettingsTarGZipReadSettings
Sıkıştırma düzeyi  Sıkıştırma oranı. İzin verilen değerler En uygun veya en hızlı değerlerdir. En uygun veya en hızlı Hayır level (altında compression):
Hızlı
En iyi
Sütun sınırlayıcısı  Bir dosyadaki sütunları ayırmak için kullanılan karakterler.  < seçili sütun sınırlayıcısı >
virgül , (varsayılan olarak)
Hayır columnDelimiter
Satır sınırlayıcısı Bir dosyadaki satırları ayırmak için kullanılan karakterdir. < seçili satır sınırlayıcısı >
\r,\n (varsayılan olarak) veya r\n
Hayır rowDelimiter
Kodlama Test dosyalarını okumak/yazmak için kullanılan kodlama türü. "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM8870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1252", "WINDOWS-11253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Hayır encodingName
Kaçış karakteri Tırnak içinde tırnak içine kaçış için tek karakter. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun. < seçtiğiniz kaçış karakteri >
ters eğik çizgi \ (varsayılan olarak)
Hayır escapeChar
Tırnak karakteri Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir. < seçtiğiniz tırnak karakteri >
çift tırnak " işareti (varsayılan olarak)
Hayır quoteChar
Üst bilgi olarak ilk satır Verilen çalışma sayfasındaki/aralıktaki ilk satırın sütun adları içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. Seçili veya seçilmemiş Hayır firstRowAsHeader:
true veya false (varsayılan)
Null değer Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir. < null değerin dize gösterimi >
boş dize (varsayılan olarak)
Hayır nullValue

Hedef olarak sınırlandırılmış metin

Sınırlandırılmış metin biçimi kullanılırken kopyalama etkinliği Hedef bölümünde aşağıdaki özellikler desteklenir.

Ad Tarif Değer Gerekli JSON betik özelliği
 Dosya biçimi Kullanmak istediğiniz dosya biçimi. Sınırlandırılmış Metin Yes type (altında datasetSettings):
Sınırlandırılmış Metin
Sıkıştırma türü Sınırlandırılmış metin dosyalarını yazmak için kullanılan sıkıştırma codec bileşeni. Aşağıdakilerden birini seçin:
Hiçbiri
bzip2
gzip
Deflate
ZipDeflate
TarGzip
tar
Hayır type (altında compression):

bzip2
gzip
Deflate
ZipDeflate
TarGzip
tar
Zip dosyası adını klasör olarak koru Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. Seçili veya seçimi kaldır Hayır preserveZipFileNameAsFolder
(altında compressionProperties->type olarak ZipDeflateReadSettings)
Sıkıştırma dosyası adını klasör olarak koru Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. Seçili veya seçimi kaldır Hayır preserveCompressionFileNameAsFolder
(altında compressionProperties->type veya )TarReadSettingsTarGZipReadSettings
Sıkıştırma düzeyi  Sıkıştırma oranı. İzin verilen değerler En uygun veya en hızlı değerlerdir. En uygun veya en hızlı Hayır level (altında compression):
Hızlı
En iyi
Sütun sınırlayıcısı  Bir dosyadaki sütunları ayırmak için kullanılan karakterler.  < seçili sütun sınırlayıcısı >
virgül , (varsayılan olarak)
Hayır columnDelimiter
Satır sınırlayıcısı Bir dosyadaki satırları ayırmak için kullanılan karakterdir. < seçili satır sınırlayıcısı >
\r,\n (varsayılan olarak) veya r\n
Hayır rowDelimiter
Kodlama Test dosyalarını okumak/yazmak için kullanılan kodlama türü. "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM8870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1252", "WINDOWS-11253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Hayır encodingName
Kaçış karakteri Tırnak içinde tırnak içine kaçış için tek karakter. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun. < seçtiğiniz kaçış karakteri >
ters eğik çizgi \ (varsayılan olarak)
Hayır escapeChar
Tırnak karakteri Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir. < seçtiğiniz tırnak karakteri >
çift tırnak " işareti (varsayılan olarak)
Hayır quoteChar
Üst bilgi olarak ilk satır Verilen çalışma sayfasındaki/aralıktaki ilk satırın sütun adları içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. Seçili veya seçilmemiş Hayır firstRowAsHeader:
true veya false (varsayılan)
Tüm metni alıntıla Tüm değerleri tırnak içine alın. Seçili (varsayılan) veya seçilmemiş Hayır quoteAllText:
true (varsayılan) veya false
Dosya uzantısı Çıkış dosyalarını adlandırmak için kullanılan dosya uzantısı. < dosya uzantınız >
.txt (varsayılan olarak)
Hayır fileExtension
Dosya başına en fazla satır Bir klasöre veri yazarken, birden çok dosyaya yazmayı ve dosya başına en fazla satırı belirtmeyi seçebilirsiniz. < dosya başına en fazla satırınız > Hayır maxRowsPerFile
Dosya adı ön eki Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir: <fileNamePrefix>_00000.<fileExtension>. Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir. < dosya adı ön ekiniz > Hayır fileNamePrefix