Einführung

Abgeschlossen

Apache Spark ist ein Open Source-Framework für die parallele Verarbeitung großer Datenmengen und Analysen. Spark ist bei der Verarbeitung von „Big Data“ beliebt geworden und ist in mehreren Plattformimplementierungen verfügbar, darunter Azure HDInsight, Azure Databricks, Azure Synapse Analytics und Microsoft Fabric.

In diesem Modul erfahren Sie, wie Sie Spark in Microsoft Fabric verwenden können, um Daten in einem Lakehouse zu erfassen, zu verarbeiten und zu analysieren. Obwohl die in diesem Modul beschriebenen Grundtechniken und der Code für alle Spark-Implementierungen gelten, vereinfachen die integrierten Tools und die Möglichkeit, mit Spark in derselben Umgebung wie andere Datendienste in Microsoft Fabric zu arbeiten, die Spark-basierte Datenverarbeitung in Ihrer gesamten Datenanalyselösung.