Wprowadzenie

Ukończone

Platforma Apache Spark udostępnia zaawansowaną platformę do wykonywania zadań oczyszczania i przekształcania danych na dużych ilościach danych. Za pomocą obiektu ramki danych Platformy Spark można łatwo ładować dane z plików w usłudze Data Lake i wykonywać złożone modyfikacje. Następnie możesz zapisać przekształcone dane z powrotem w usłudze Data Lake na potrzeby przetwarzania podrzędnego lub pozyskiwania danych w magazynie danych.

Usługa Azure Synapse Analytics udostępnia pule platformy Apache Spark, których można użyć do uruchamiania obciążeń platformy Spark w celu przekształcania danych w ramach obciążenia pozyskiwania i przygotowywania danych. Notesy obsługiwane natywnie umożliwiają pisanie i uruchamianie kodu w puli Spark w celu przygotowania danych do analizy. Następnie możesz użyć innych funkcji usługi Azure Synapse Analytics, takich jak pule SQL, aby pracować z przekształconymi danymi.