ORC-format i Data Factory i Microsoft Fabric

Den här artikeln beskriver hur du konfigurerar ORC-format i datapipelinen för Data Factory i Microsoft Fabric.

Funktioner som stöds

ORC-format stöds för följande aktiviteter och anslutningsappar som källa och mål.

Kategori Anslutningsapp/aktivitet
Anslutningsprogram som stöds Amazon S3
Amazon S3-kompatibel
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Azure Files
Filsystem
FTP
Google Cloud Storage
HTTP
Lakehouse-filer
Oracle Cloud Storage
SFTP
Aktivitet som stöds Kopieringsaktivitet (källa/mål)
Sökningsaktivitet
GetMetadata-aktivitet
Ta bort dataaktivitet

ORC-format i kopieringsaktivitet

Om du vill konfigurera ORC-format väljer du din anslutning i källan eller målet för kopieringsaktiviteten för datapipelinen och väljer sedan ORC i listrutan filformat. Välj Inställningar för ytterligare konfiguration av det här formatet.

Skärmbild som visar inställningar för filformat.

ORC-format som källa

När du har valt Inställningar i avsnittet Filformat visas följande egenskaper i dialogrutan Inställningar för filformat i popup-fönstret.

Skärmbild som visar ORC-filformatkällan.

  • Komprimeringstyp: Välj den komprimeringskodc som används för att läsa ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.

ORC-format som mål

När du har valt Inställningar visas följande egenskaper i dialogrutan inställningar för filformat i popup-fönstret.

Skärmbild som visar ORC-filformatmålet.

  • Komprimeringstyp: Välj den komprimeringskodc som används för att skriva ORC-filer i listrutan. Du kan välja mellan Ingen, zlib eller snappy.

Under Avancerade inställningar på fliken Mål visas följande ORC-formatrelaterade egenskaper.

  • Maximalt antal rader per fil: När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil.
  • Filnamnsprefix: Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret: <fileNamePrefix>_00000.<fileExtension>. Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager.

Tabellsammanfattning

ORC som källa

Följande egenskaper stöds i avsnittet Käll för kopieringsaktivitet när du använder ORC-format.

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Filformat Det filformat som du vill använda. ORCH Ja typ (under datasetSettings):
Orch
Komprimeringstyp Komprimeringskodcen som används för att läsa ORC-filer. None
zlib
kvick
Nej orcCompressionCodec:
inget
zlib
kvick

ORC som mål

Följande egenskaper stöds i avsnittet Mål för kopieringsaktivitet när du använder ORC-formatet.

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Filformat Det filformat som du vill använda. ORCH Ja typ (under datasetSettings):
Orch
Komprimeringstyp Komprimeringskodcen som används för att skriva ORC-filer. None
zlib
kvick
Nej orcCompressionCodec:
inget
zlib
kvick
Maximalt antal rader per fil När du skriver data till en mapp kan du välja att skriva till flera filer och ange maximalt antal rader per fil. Ange maximalt antal rader som du vill skriva per fil. <maximalt antal rader per fil> Nej maxRowsPerFile
Filnamnsprefix Gäller när Maximalt antal rader per fil har konfigurerats. Ange filnamnsprefixet när du skriver data till flera filer, vilket resulterade i det här mönstret: <fileNamePrefix>_00000.<fileExtension>. Om det inte anges genereras filnamnsprefixet automatiskt. Den här egenskapen gäller inte när källan är ett filbaserat arkiv eller ett partitionsalternativ aktiverat datalager. <ditt filnamnsprefix> Nej fileNamePrefix