รูปแบบ ORC ใน Data Factory ใน Microsoft Fabric

บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ ORC ในไปป์ไลน์ข้อมูลของ Data Factory ใน Microsoft Fabric

ความสามารถที่รองรับ

รูปแบบ ORC ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นต้นทางและปลายทาง

หมวดหมู่ ตัวเชื่อมต่อ/กิจกรรม
ตัวเชื่อมต่อที่สนับสนุน Amazon S3
เข้ากันได้กับ Amazon S3
ที่เก็บข้อมูล Azure Blob
Azure Data Lake Storage Gen1
Azure Data Lake Storage รุ่น2
ไฟล์ Azure
ระบบไฟล์
FTP
พื้นที่เก็บข้อมูล Google Cloud
HTTP
ไฟล์ของเลคเฮ้าส์
ที่เก็บข้อมูล Oracle Cloud
SFTP
กิจกรรมที่ได้รับการสนับสนุน คัดลอกกิจกรรม (ต้นทาง/ปลายทาง)
ค้นหากิจกรรม
กิจกรรม GetMetadata
ลบกิจกรรมข้อมูล

รูปแบบ ORC ในกิจกรรมการคัดลอก

ในการกําหนดค่ารูปแบบ ORC ให้เลือกการเชื่อมต่อของคุณในต้นทางหรือปลายทางของกิจกรรมการคัดลอกไปป์ไลน์ข้อมูลจากนั้นเลือก ORC ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้

สกรีนช็อตที่แสดงการตั้งค่ารูปแบบไฟล์

รูปแบบ ORC เป็นแหล่งข้อมูล

หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ

สกรีนช็อตที่แสดงแหล่งข้อมูลรูปแบบไฟล์ ORC

  • ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้อ่านไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy

รูปแบบ ORC เป็นปลายทาง

หลังจากที่คุณเลือก การตั้งค่า คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ

สกรีนช็อตที่แสดงปลายทางรูปแบบไฟล์ ORC

  • ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy

ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ ปลายทาง คุณสมบัติที่เกี่ยวข้องกับรูปแบบ ORC ต่อไปนี้จะแสดงขึ้นมา

  • แถวสูงสุดต่อไฟล์: เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์
  • คํานําหน้าชื่อไฟล์: ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้: <fileNamePrefix>_00000.<fileExtension> ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล

ข้อมูลสรุปของตาราง

ORC เป็นแหล่งข้อมูล

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมคัดลอกเมื่อใช้รูปแบบ ORC

ชื่อ รายละเอียด ค่า ต้องมี คุณสมบัติสคริปต์ JSON
รูปแบบไฟล์ รูปแบบไฟล์ที่คุณต้องการใช้ ORC ใช่ type (ภายใต้ datasetSettings):
Orc
ชนิดการบีบอัด ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ ORC ไม่มี
zlib
snappy
ไม่ orcCompressionCodec:
ไม่มี
zlib
snappy

ORC เป็นปลายทาง

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนคัดลอกปลายทางกิจกรรมเมื่อใช้รูปแบบ ORC

ชื่อ รายละเอียด ค่า ต้องมี คุณสมบัติสคริปต์ JSON
รูปแบบไฟล์ รูปแบบไฟล์ที่คุณต้องการใช้ ORC ใช่ type (ภายใต้ datasetSettings):
Orc
ชนิดการบีบอัด ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC ไม่มี
zlib
snappy
ไม่ orcCompressionCodec:
ไม่มี
zlib
snappy
แถวสูงสุดต่อไฟล์ เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์ <แถวสูงสุดของคุณต่อไฟล์> ไม่ maxRowsPerFile
คํานําหน้าชื่อไฟล์ ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้: <fileNamePrefix>_00000.<fileExtension> ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล <คํานําหน้าชื่อไฟล์ของคุณ> ไม่ fileNamePrefix