Inżynieria danych za pomocą pul zadań platformy Apache Spark w usłudze Azure Synapse

Średni
Data Engineer
Azure Synapse Analytics

Apache Spark to wysoce skalowalne rozwiązanie do przetwarzania rozproszonego na potrzeby analizy i przekształcania danych big data. Możliwości tej usługi można wykorzystać w usłudze Azure Synapse Analytics przy użyciu pul platformy Spark.

Wymagania wstępne

Przed rozpoczęciem tej ścieżki szkoleniowej należy zapoznać się z usługą Azure Synapse Analytics. Najpierw rozważ ukończenie modułu Introduction to Azure Synapse Analytics (Wprowadzenie do usługi Azure Synapse Analytics ).

Moduły w ramach tej ścieżki szkoleniowej

Apache Spark to podstawowa technologia do analizy danych na dużą skalę. Dowiedz się, jak używać platformy Spark w usłudze Azure Synapse Analytics do analizowania i wizualizowania danych w usłudze Data Lake.

Inżynierowie danych często muszą przekształcać duże ilości danych. Pule platformy Apache Spark w usłudze Azure Synapse Analytics zapewniają rozproszoną platformę przetwarzania, której mogą użyć do osiągnięcia tego celu.

Usługa Delta Lake to obszar magazynu relacyjnego typu open source dla platformy Spark, którego można użyć do zaimplementowania architektury usługi Data Lakehouse w usłudze Azure Synapse Analytics.