Jämför filidentifieringslägen för automatisk inläsning

Automatisk inläsning stöder två lägen för att identifiera nya filer: kataloglista och filavisering. Du kan växla filidentifieringslägen mellan strömomstarter och ändå få garantier för databearbetning exakt en gång.

Kataloglistningsläge

I kataloglistningsläge identifierar Auto Loader nya filer genom att visa indatakatalogen. Med kataloglistningsläget kan du snabbt starta automatiska inläsningsströmmar utan några andra behörighetskonfigurationer än åtkomst till dina data i molnlagringen.

I Databricks Runtime 9.1 och senare kan Auto Loader automatiskt identifiera om filer anländer med lexikal beställning till molnlagringen och avsevärt minska mängden API-anrop som behövs för att identifiera nya filer. Mer information finns i Vad är kataloglistningsläge för automatisk inläsning?

Läge för filavisering

I filmeddelandeläget används filmeddelanden och kötjänster i ditt molninfrastrukturkonto. Automatisk inläsning kan automatiskt konfigurera en meddelandetjänst och kötjänst som prenumererar på filhändelser från indatakatalogen.

Filmeddelandeläget är mer högpresterande och skalbart för stora indatakataloger eller en stor mängd filer, men kräver ytterligare molnbehörigheter för att konfigurera. Mer information finns i Vad är meddelandeläget för automatisk inläsningsfil?.

Molnlagring som stöds av lägen

Tillgängligheten för dessa lägen visas nedan.

Om du migrerar från en extern plats eller en DBFS-montering till en Unity Catalog-volym fortsätter Auto Loader att ge garantier exakt en gång.

Molnlagring Kataloglista Filmeddelanden
AWS S3 Alla versioner Alla versioner
ADLS Gen2 Alla versioner Alla versioner
GCS Alla versioner Databricks Runtime 9.1 och senare
Azure Blob Storage Alla versioner Alla versioner
ADLS Gen1 Alla versioner Stöd saknas
DBFS Alla versioner Endast för monteringspunkter
Unity Catalog-volym Databricks Runtime 13.3 LTS och senare Stöds inte