Przekształcanie danych za pomocą platformy Spark w usłudze Azure Synapse Analytics

Średni
Data Engineer
Azure Synapse Analytics

Inżynierowie danych często muszą przekształcać duże ilości danych. Pule platformy Apache Spark w usłudze Azure Synapse Analytics zapewniają rozproszoną platformę przetwarzania, której mogą użyć do osiągnięcia tego celu.

Cele szkolenia

Ten moduł obejmuje następujące zagadnienia:

  • Modyfikowanie i zapisywanie ramek danych przy użyciu platformy Apache Spark
  • Partycjonowanie plików danych w celu zwiększenia wydajności i skalowalności.
  • Przekształcanie danych przy użyciu języka SQL

Wymagania wstępne

Przed rozpoczęciem pracy z tym modułem należy zapoznać się z pulami platformy Apache Spark w usłudze Azure Synapse Analytics. Najpierw rozważ ukończenie modułu Analyze data with Apache Spark in Azure Synapse Analytics (Analizowanie danych za pomocą platformy Apache Spark w usłudze Azure Synapse Analytics ).