Usare Apache Spark in Microsoft Fabric
Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Microsoft Fabric offre supporto per i cluster Spark, consentendo di analizzare ed elaborare i dati in un lakehouse su larga scala.
Obiettivi di apprendimento
Contenuto del modulo:
- Configurare Spark in un'area di lavoro di Microsoft Fabric
- Identificare scenari adatti per notebook Spark e processi Spark
- Usare Spark per connettersi all'origine dati e inserire dati
- Usare i dataframe Spark per analizzare e trasformare i dati
- Usare Spark SQL per eseguire query sui dati in tabelle e viste
- Visualizzare i dati in un notebook Spark
Prerequisiti
Prima di iniziare questo modulo, è necessario avere familiarità con l'interfaccia e i concetti di base di Microsoft Fabric.