Lesen von Parquet-Dateien mit Azure Databricks

Dieser Artikel erklärt, wie Sie Daten aus Parquet-Dateien mithilfe von Azure Databricks lesen.

Was ist Parquet?

Apache Parquet ist ein spaltenbasiertes Dateiformat mit Optimierungen zur Beschleunigung von Abfragen. Dieses Dateiformat ist effizienter als CSV oder JSON.

Weitere Informationen finden Sie unter Parquet-Dateien.

Optionen

Die unterstützten Optionen für Lesen und Schreiben finden Sie in den folgenden Apache Spark-Referenzartikeln.

Notebookbeispiel: Lesen und Schreiben in Parquet-Dateien

Im folgenden Notebook wird gezeigt, wie Sie Daten in Parquet-Dateien lesen und schreiben können.

Notebook zum Lesen von Parquet-Dateien

Notebook abrufen