Microsoft Fabric'te Data Factory'de sınırlandırılmış metin biçimi
Bu makalede, Microsoft Fabric'teki Data Factory'nin veri işlem hattında sınırlandırılmış metin biçiminin nasıl yapılandırılır?
Desteklenen özellikler
Sınırlanmış metin biçimi, kaynak ve hedef olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.
Kategori | Bağlayıcı/Etkinlik |
---|---|
Desteklenen bağlayıcı | Amazon S3 |
Amazon S3 Uyumlu | |
Azure Blob Depolama | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage 2. Nesil | |
Azure Dosyaları | |
Dosya sistemi | |
FTP | |
Google Cloud Storage | |
HTTP | |
Lakehouse Dosyaları | |
Oracle Cloud Storage | |
SFTP | |
Desteklenen etkinlik | Kopyalama etkinliği (kaynak/hedef) |
Arama etkinliği | |
GetMetadata etkinliği | |
Silme etkinliği |
Kopyalama etkinliğinde sınırlandırılmış metin biçimi
Sınırlandırılmış metin biçimini yapılandırmak için, veri işlem hattı kopyalama etkinliğinin kaynağında veya hedefinde bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde Sınırlanmış Metin'i seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.
Kaynak olarak sınırlandırılmış metin biçimi
Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.
Sıkıştırma türü: Sınırlandırılmış metin dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Açılan listede Yok, bzip2, gzip, deflate, ZipDeflate, TarGzip veya tar türü arasından seçim yapabilirsiniz.
Sıkıştırma türü olarak ZipDeflate'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Zip dosyası adını klasör olarak koru seçeneği gösterilir.
- Zip dosyası adını klasör olarak koru: Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine
<specified file path>/<folder named as source zip file>/
yazar. - Bu kutunun işareti kaldırılırsa, hizmet sıkıştırması açılmış dosyaları doğrudan adresine
<specified file path>
yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırması açılmış dosyaları öğesine
Sıkıştırma türü olarak TarGzip/tar'ı seçerseniz, Kaynak sekmesindeki Gelişmiş ayarlar altında Sıkıştırma dosyası adını klasör olarak koru gösterilir.
- Sıkıştırma dosyası adını klasör olarak koru: Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine
<specified file path>/<folder named as source compressed file>/
yazar. - Bu kutunun işareti kaldırılırsa, hizmet sıkıştırılan dosyaları doğrudan öğesine
<specified file path>
yazar. Yarış veya beklenmeyen davranışlardan kaçınmak için farklı kaynak zip dosyalarında yinelenen dosya adlarının olmadığından emin olun.
- Bu kutu işaretliyse (varsayılan), hizmet sıkıştırılmış dosyaları öğesine
- Zip dosyası adını klasör olarak koru: Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir.
Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En uygun veya en hızlı arasından seçim yapabilirsiniz.
- En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
- En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
Sütun sınırlayıcısı: Dosyadaki sütunları ayırmak için kullanılan karakterler. Varsayılan değer virgüldür (
,
).Satır sınırlayıcısı: Dosyadaki satırları ayırmak için kullanılan karakteri belirtin. Yalnızca bir karaktere izin verilir. Varsayılan değer satır akışıdır
\n
.Kodlama: Test dosyalarını okumak/yazmak için kullanılan kodlama türü. Varsayılan değer UTF-8'dir.
Kaçış karakteri: Tırnak içine alınmış bir değer içinde çıkış tırnak içine tek karakter. Varsayılan değer ters eğik çizgidir
\
. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun.Tırnak karakteri: Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Varsayılan değer çift tırnaktır
"
. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir.Üst bilgi olarak ilk satır: İlk satırın sütun adlarını içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. İzin verilen değerler seçilir ve seçilmemiştir (varsayılan). Üst bilgi olarak ilk satır seçilmediğinde, kullanıcı arabirimi veri önizlemesi ve arama etkinliği çıktısı sütun adlarını otomatik olarak Prop_{n} olarak oluşturur (0'dan başlayarak), kopyalama etkinliği kaynaktan hedefe açık eşleme gerektirir ve sütunları sıralı olarak (1'den başlayarak) bulur.
Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.
Kaynak sekmesindeki Gelişmiş ayarlar'ın altında, sınırlandırılmış metin biçimiyle ilgili diğer özellikler gösterilir.
Hedef olarak sınırlandırılmış metin biçimi
Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.
Sıkıştırma türü: Sınırlandırılmış metin dosyalarını yazmak için kullanılan sıkıştırma codec bileşeni. Açılan listede Yok, bzip2, gzip, deflate, ZipDeflate, TarGzip veya tar türü arasından seçim yapabilirsiniz.
Sıkıştırma düzeyi: Sıkıştırma türünü seçtiğinizde sıkıştırma oranını belirtin. En uygun veya en hızlı arasından seçim yapabilirsiniz.
- En hızlı: Elde edilen dosya en iyi şekilde sıkıştırılmasa bile sıkıştırma işlemi mümkün olan en hızlı şekilde tamamlanmalıdır.
- En uygun: İşlemin tamamlanması daha uzun sürse bile sıkıştırma işlemi en iyi şekilde sıkıştırılmalıdır. Daha fazla bilgi için Bkz . Sıkıştırma Düzeyi konusu.
Sütun sınırlayıcısı: Dosyadaki sütunları ayırmak için kullanılan karakterler. Varsayılan değer virgüldür (
,
).Satır sınırlayıcısı: Dosyadaki satırları ayırmak için kullanılan karakter. Yalnızca bir karaktere izin verilir. Varsayılan değer satır akışıdır
\n
.Kodlama: Test dosyalarını yazmak için kullanılan kodlama türü. Varsayılan değer UTF-8'dir.
Kaçış karakteri: Tırnak içine alınmış bir değer içinde çıkış tırnak içine tek karakter. Varsayılan değer ters eğik çizgidir
\
. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun.Tırnak karakteri: Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Varsayılan değer çift tırnaktır
"
. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir.Üst bilgi olarak ilk satır: İlk satırın sütun adlarını içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. İzin verilen değerler seçilir ve seçilmemiştir (varsayılan). Üst bilgi olarak ilk satır seçilmediğinde, kullanıcı arabirimi veri önizlemesi ve arama etkinliği çıktısı sütun adlarını otomatik olarak Prop_{n} olarak oluşturur (0'dan başlayarak), kopyalama etkinliği kaynaktan hedefe açık eşleme gerektirir ve sütunları sıralı olarak (1'den başlayarak) bulur.
Null değer: Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir.
Hedef sekmesindeki Gelişmiş ayarlar'ın altında, sınırlandırılmış metin biçimiyle ilgili daha fazla özellik gösterilir.
Tüm metni alıntıla: Tüm değerleri tırnak içine alın.
Dosya uzantısı: Çıktı dosyalarını adlandırmak için kullanılan dosya uzantısı, örneğin,
.csv
,.txt
.Dosya başına en fazla satır: Bir klasöre veri yazarken, birden çok dosyaya yazmayı ve dosya başına en fazla satırı belirtmeyi seçebilirsiniz.
Dosya adı ön eki: Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir:
<fileNamePrefix>_00000.<fileExtension>
. Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir.
Tablo özeti
Kaynak olarak sınırlandırılmış metin
Sınırlandırılmış metin biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.
Ad | Tarif | Değer | Gerekli | JSON betik özelliği |
---|---|---|---|---|
Dosya biçimi | Kullanmak istediğiniz dosya biçimi. | Sınırlandırılmış Metin | Yes | type (altında datasetSettings ):Sınırlandırılmış Metin |
Sıkıştırma türü | Sınırlandırılmış metin dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. | Aşağıdakilerden birini seçin: Hiçbiri bzip2 gzip Deflate ZipDeflate TarGzip tar |
Hayır | type (altında compression ): bzip2 gzip Deflate ZipDeflate TarGzip tar |
Zip dosyası adını klasör olarak koru | Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. Sıkıştırmayı ZipDeflate'ı seçtiğinizde geçerlidir. | Seçili veya seçimi kaldır | Hayır | preserveZipFileNameAsFolder (altında compressionProperties ->type olarak ZipDeflateReadSettings ) |
Sıkıştırma dosyası adını klasör olarak koru | Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. TarGzip/tar sıkıştırmayı seçtiğinizde geçerlidir. | Seçili veya seçimi kaldır | Hayır | preserveCompressionFileNameAsFolder (altında compressionProperties ->type veya )TarReadSettings TarGZipReadSettings |
Sıkıştırma düzeyi | Sıkıştırma oranı. İzin verilen değerler En uygun veya en hızlı değerlerdir. | En uygun veya en hızlı | Hayır | level (altında compression ): Hızlı En iyi |
Sütun sınırlayıcısı | Bir dosyadaki sütunları ayırmak için kullanılan karakterler. | < seçili sütun sınırlayıcısı > virgül , (varsayılan olarak) |
Hayır | columnDelimiter |
Satır sınırlayıcısı | Bir dosyadaki satırları ayırmak için kullanılan karakterdir. | < seçili satır sınırlayıcısı > \r ,\n (varsayılan olarak) veya r\n |
Hayır | rowDelimiter |
Kodlama | Test dosyalarını okumak/yazmak için kullanılan kodlama türü. | "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM8870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1252", "WINDOWS-11253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Hayır | encodingName |
Kaçış karakteri | Tırnak içinde tırnak içine kaçış için tek karakter. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun. | < seçtiğiniz kaçış karakteri > ters eğik çizgi \ (varsayılan olarak) |
Hayır | escapeChar |
Tırnak karakteri | Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir. | < seçtiğiniz tırnak karakteri > çift tırnak " işareti (varsayılan olarak) |
Hayır | quoteChar |
Üst bilgi olarak ilk satır | Verilen çalışma sayfasındaki/aralıktaki ilk satırın sütun adları içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. | Seçili veya seçilmemiş | Hayır | firstRowAsHeader: true veya false (varsayılan) |
Null değer | Null değerin dize gösterimini belirtir. Varsayılan değer boş dizedir. | < null değerin dize gösterimi > boş dize (varsayılan olarak) |
Hayır | nullValue |
Hedef olarak sınırlandırılmış metin
Sınırlandırılmış metin biçimi kullanılırken kopyalama etkinliği Hedef bölümünde aşağıdaki özellikler desteklenir.
Ad | Tarif | Değer | Gerekli | JSON betik özelliği |
---|---|---|---|---|
Dosya biçimi | Kullanmak istediğiniz dosya biçimi. | Sınırlandırılmış Metin | Yes | type (altında datasetSettings ):Sınırlandırılmış Metin |
Sıkıştırma türü | Sınırlandırılmış metin dosyalarını yazmak için kullanılan sıkıştırma codec bileşeni. | Aşağıdakilerden birini seçin: Hiçbiri bzip2 gzip Deflate ZipDeflate TarGzip tar |
Hayır | type (altında compression ): bzip2 gzip Deflate ZipDeflate TarGzip tar |
Zip dosyası adını klasör olarak koru | Kopyalama sırasında kaynak zip dosyası adının klasör yapısı olarak korunup korunmayacağını gösterir. | Seçili veya seçimi kaldır | Hayır | preserveZipFileNameAsFolder (altında compressionProperties ->type olarak ZipDeflateReadSettings ) |
Sıkıştırma dosyası adını klasör olarak koru | Kaynak sıkıştırılmış dosya adının kopyalama sırasında klasör yapısı olarak korunup korunmayacağını gösterir. | Seçili veya seçimi kaldır | Hayır | preserveCompressionFileNameAsFolder (altında compressionProperties ->type veya )TarReadSettings TarGZipReadSettings |
Sıkıştırma düzeyi | Sıkıştırma oranı. İzin verilen değerler En uygun veya en hızlı değerlerdir. | En uygun veya en hızlı | Hayır | level (altında compression ): Hızlı En iyi |
Sütun sınırlayıcısı | Bir dosyadaki sütunları ayırmak için kullanılan karakterler. | < seçili sütun sınırlayıcısı > virgül , (varsayılan olarak) |
Hayır | columnDelimiter |
Satır sınırlayıcısı | Bir dosyadaki satırları ayırmak için kullanılan karakterdir. | < seçili satır sınırlayıcısı > \r ,\n (varsayılan olarak) veya r\n |
Hayır | rowDelimiter |
Kodlama | Test dosyalarını okumak/yazmak için kullanılan kodlama türü. | "UTF-8" (varsayılan olarak),"UTF-8 without BOM", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM8870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1252", "WINDOWS-11253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Hayır | encodingName |
Kaçış karakteri | Tırnak içinde tırnak içine kaçış için tek karakter. Kaçış karakteri boş dize olarak tanımlandığında, Tırnak karakteri de boş dize olarak ayarlanmalıdır; bu durumda tüm sütun değerlerinin sınırlayıcı içermediğinden emin olun. | < seçtiğiniz kaçış karakteri > ters eğik çizgi \ (varsayılan olarak) |
Hayır | escapeChar |
Tırnak karakteri | Sütun sınırlayıcısı içeriyorsa, sütun değerlerini tırnak içine almak için tek karakter. Tırnak karakteri boş dize olarak tanımlandığında, tırnak karakteri olmadığı ve sütun değerinin tırnak içinde olmadığı ve çıkış karakterinin sütun sınırlayıcısından ve kendisinden kaçmak için kullanıldığı anlamına gelir. | < seçtiğiniz tırnak karakteri > çift tırnak " işareti (varsayılan olarak) |
Hayır | quoteChar |
Üst bilgi olarak ilk satır | Verilen çalışma sayfasındaki/aralıktaki ilk satırın sütun adları içeren bir üst bilgi satırı olarak işlenip ele alınmayacağını belirtir. | Seçili veya seçilmemiş | Hayır | firstRowAsHeader: true veya false (varsayılan) |
Tüm metni alıntıla | Tüm değerleri tırnak içine alın. | Seçili (varsayılan) veya seçilmemiş | Hayır | quoteAllText: true (varsayılan) veya false |
Dosya uzantısı | Çıkış dosyalarını adlandırmak için kullanılan dosya uzantısı. | < dosya uzantınız > .txt (varsayılan olarak) |
Hayır | fileExtension |
Dosya başına en fazla satır | Bir klasöre veri yazarken, birden çok dosyaya yazmayı ve dosya başına en fazla satırı belirtmeyi seçebilirsiniz. | < dosya başına en fazla satırınız > | Hayır | maxRowsPerFile |
Dosya adı ön eki | Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir: <fileNamePrefix>_00000.<fileExtension> . Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir. |
< dosya adı ön ekiniz > | Hayır | fileNamePrefix |