Leitura de arquivos Parquet usando o Azure Databricks

Este artigo mostra como ler dados de arquivos do Apache Parquet usando o Azure Databricks.

O que é o Parquet?

O Apache Parquet é um formato de arquivo em coluna com otimizações para acelerar as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.

Para obter mais informações, confira Arquivos Parquet.

Opções

Confira os seguintes artigos de referência sobre o Apache Spark para ver opções de leitura e gravação com suporte.

Exemplo de notebook: ler e gravar em arquivos Parquet

O notebook a seguir mostra como ler e gravar dados em arquivos Parquet.

Leitura do notebook de arquivos Parquet

Obter notebook