Runtime di Fabric 1.3 (anteprima pubblica)

Articolo
05/21/2024

Il runtime di Infrastruttura offre un'integrazione perfetta con Azure. Offre un ambiente sofisticato sia per la progettazione dei dati che per i progetti di data science che usano Apache Spark. Questo articolo offre una panoramica delle funzionalità e dei componenti essenziali di Fabric Runtime 1.3, il runtime più recente per i calcoli di Big Data.

Fabric Runtime 1.3 incorpora i componenti e gli aggiornamenti seguenti progettati per migliorare le funzionalità di elaborazione dei dati:

Apache Spark 3.5
Sistema operativo: Mariner 2.0
Java: 11
Scala: 2.12.17
Python: 3.11
Delta Lake: 3.1
R: 4.3.3

Nota

Fabric Runtime 1.3 è attualmente in una fase di anteprima pubblica. Le integrazioni con VSCode e Unione casuale bassa non sono supportate nella versione di anteprima pubblica.

Usare le istruzioni seguenti per integrare il runtime 1.3 nell'area di lavoro e usare le nuove funzionalità:

Passare alla scheda Impostazioni area di lavoro all'interno dell'area di lavoro infrastruttura.
Passare alla scheda Ingegneria dei dati/Scienza e selezionare Impostazioni Spark.
Fare clic sulla scheda Ambiente.
Nell'elenco a discesa Versioni di runtime selezionare 1.3 Anteprima pubblica (Spark 3.5, Delta 3.1) e salvare le modifiche. Questa azione imposta 1.3 come runtime predefinito per l'area di lavoro.

È ora possibile iniziare a usare i miglioramenti e le funzionalità più recenti introdotti in Runtime di Fabric 1.3 (Spark 3.5 e Delta Lake 3.1).

Suggerimento

Per informazioni aggiornate, un elenco dettagliato delle modifiche e specifiche note sulla versione per i runtime di Fabric, controllare e sottoscrivere versioni e aggiornamenti di Spark Runtimes.

In primo piano

Apache Spark 3.5

Apache Spark 3.5.0 è la sesta versione della serie 3.x. Questa versione è un prodotto di ampia collaborazione all'interno della community open source, risolvendo più di 1.300 problemi come registrato in Jira.

In questa versione è disponibile un aggiornamento della compatibilità per lo streaming strutturato. Inoltre, questa versione amplia le funzionalità all'interno di PySpark e SQL. Aggiunge funzionalità come la clausola dell'identificatore SQL, gli argomenti denominati nelle chiamate di funzione SQL e l'inclusione di funzioni SQL per le aggregazioni approssimative di HyperLogLog. Altre nuove funzionalità includono anche funzioni di tabella definite dall'utente Python, la semplificazione del training distribuito tramite DeepSpeed e nuove funzionalità di streaming strutturate come la propagazione della filigrana e l'operazione dropDuplicatesWithinWatermark .

È possibile controllare l'elenco completo e le modifiche dettagliate qui: https://spark.apache.org/releases/spark-release-3-5-0.html.

Delta Spark

Delta Lake 3.1 è un impegno collettivo per rendere l'interoperabilità delta Lake tra formati, più facile da usare e prestazioni più elevate. Delta Spark 3.1.0 è basato su Apache Spark™ 3.5. L'artefatto maven di Delta Spark è stato rinominato da delta-core a delta-spark.

È possibile controllare l'elenco completo e le modifiche dettagliate qui: https://docs.delta.io/3.1.0/index.html.

Nota

Condividere commenti e suggerimenti su Fabric Runtime nella piattaforma Ideas. Assicurarsi di menzionare la versione e la fase di rilascio a cui si fa riferimento. Microsoft valuta il feedback della community e assegna priorità ai miglioramenti in base ai voti, assicurandosi di soddisfare le esigenze degli utenti.

Condividi tramite

Runtime di Fabric 1.3 (anteprima pubblica)

In primo piano

Apache Spark 3.5

Delta Spark

Commenti e suggerimenti

Risorse aggiuntive

Condividi tramite

Runtime di Fabric 1.3 (anteprima pubblica)

In primo piano

Apache Spark 3.5

Delta Spark

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive