Giugno 2021

Queste funzionalità e i miglioramenti alla piattaforma Azure Databricks sono stati rilasciati a giugno 2021.

Nota

Le versioni vengono gestite in staging. L'account Azure Databricks potrebbe non essere aggiornato fino a una settimana o più dopo la data di rilascio iniziale.

Correzione: Repos for Git è abilitato per impostazione predefinita nelle aree di lavoro nuove ed esistenti in alcune aree

30 giugno 2021

In una nota sulla versione per il 2 giugno 2021, Databricks ha annunciato che Repos for Git è abilitato per impostazione predefinita nelle nuove aree di lavoro in alcune regioni, ma ha omesso i dettagli importanti seguenti: Repos for Git è abilitato anche nelle aree di lavoro esistenti se il Notebook Git Versioning è già abilitato. Le note sulla versione originale sono state aggiornate.

Passare alle autorizzazioni di Feature Store

28 giugno - 6 luglio 2021: versione 3.49

Gli utenti con autorizzazione CAN_VIEW_METADATA per una tabella delle funzionalità possono ora pubblicarla negli archivi online.

Miglioramento dell’accesso ai risultati nella tabella delle esecuzioni di MLflow

28 giugno - 6 luglio 2021: versione 3.49

Le modifiche apportate alla tabella delle esecuzioni di MLflow offrono un accesso più rapido ai risultati.

  • Le colonne Metriche vengono ora visualizzate prima delle colonne Parametri, semplificando così l'identificazione dell'esecuzione migliore.
  • La colonna Ora di inizio mostra ora l'età dell'esecuzione, non l'ora di inizio. Ciò riduce la larghezza della colonna e consente di visualizzare più informazioni senza dover scorrere in orizzontale. Per visualizzare l'ora di inizio, passare il puntatore del mouse sul valore nella colonna.

Passare il puntatore del mouse sull'ora di inizio

Migliore visibilità dei costi per le tabelle live Delta

28 giugno - 6 luglio 2021: versione 3.49

Quando si crea una nuova pipeline o si visualizza l'interfaccia utente Dettagli pipeline, verrà visualizzata la DBU all'ora per il cluster predefinito Delta Live Tables.

Vincoli di qualità dei dati avanzati per le tabelle live Delta

28 giugno - 6 luglio 2021: versione 3.49

È ora possibile usare le API Python expect_all_or_fail, expect_all_or_drop e expect_all per definire più vincoli di qualità dei dati nei set di Delta Live Tables. Queste API sono utili quando si applica una libreria di aspettative comuni a uno o più set di dati in una pipeline. Per ulteriori informazioni, vedere Gestire la qualità dei dati con Delta Live Tables.

Modifiche API per l'aggiornamento e la sostituzione degli elenchi di indirizzi IP

28 giugno - 6 luglio 2021: versione 3.49

Una nuova operazione PATCH per /ip-access-lists/<list-id> nell'API REST Databricks 2.0 consente di aggiornare a livello di codice i singoli valori in un elenco di indirizzi IP esistente. Per ulteriori informazioni, vedere Aggiornare un elenco di accesso IP.

L'operazione esistente PUT per /ip-access-lists/<list-id> nell'API REST Databricks 2.0 consente di sostituire a livello di codice il contenuto di un elenco di indirizzi IP esistente mantenendo l'ID interno originale dell'elenco. Per ulteriori informazioni, vedere l'articolo su come sostituire un elenco di accesso IP.

Driver ODBC di Databricks 2.6.17

22 giugno 2021

È stata rilasciata la versione 2.6.17 del driver ODBC di Databricks (download). Questa versione aggiunge il supporto per Cloud Fetch, un meccanismo di recupero dei dati in parallelo tramite l'archiviazione cloud per portare i dati più velocemente agli strumenti di BI. Questa versione riduce anche la latenza rimuovendo round trip non necessari tra il client e Databricks Runtime. Vedere Come è stata ottenuta la connettività a larghezza di banda elevata con gli strumenti di Business Intelligence.

Termine del supporto di Databricks Runtime serie 7.5

16 giugno 2021

Il 16 giugno è terminato il supporto per Databricks Runtime 7.5, Databricks Runtime 7.5 per Machine Learning e Databricks Runtime 7.5 per Genomica. Vedere Cicli di vita del supporto di Databricks.

Ottimizzare i costi di prestazioni e controllo usando pool diversi per il nodo driver e i nodi di lavoro

14-21 giugno 2021: versione 3.48

È ora possibile ottimizzare il cluster collegandolo a un pool diverso per il nodo del driver e i nodi di lavoro. Ad esempio, è possibile usare un pool ottimizzato per il calcolo per il nodo del driver e un pool ottimizzato per l'archiviazione per i nodi. Ciò consente anche di controllare i costi assegnando tag diversi a ogni pool di istanze. Se si sceglie, è possibile usare lo stesso pool per i driver e i nodi di lavoro.

Per ulteriori informazioni, vedere le Informazioni di riferimento sulla configurazione in pool.

Autorizzazioni a livello di Registro di sistema per il Registro modelli

14-21 giugno 2021: versione 3.48

È ora possibile impostare le autorizzazioni predefinite del modello per tutti i modelli nel Registro modelli di un'area di lavoro. Le autorizzazioni impostate a questo livello si applicano a tutti i modelli nuovi ed esistenti registrati nel Registro modelli in tale area di lavoro. Per ulteriori informazioni, vedere ACL dei modelli MLflow.

La home directory di un utente non è più protetta quando si elimina un utente usando l’API SCIM

14-21 giugno 2021: versione 3.48

Quando si elimina un utente usando l'API SCIM, la home directory dell'utente non è più protetta e un amministratore dell'area di lavoro può eliminarla. Questo comportamento corrisponde a ciò che accade quando si elimina un utente usando la console di amministrazione.

Databricks Runtime 8.3 e 8.3 ML sono disponibili a livello generale; 8.3 Photon è anteprima pubblica

8 giugno 2021

Databricks Runtime 8.3 e 8.3 ML sono ora disponibili a livello generale. 8.3 Photon è disponibile in anteprima pubblica.

Per informazioni vedere le note sulla versione di Databricks Runtime 8.3 (EoS) e Databricks Runtime 8.3 for ML (EoS).

Controllo di accesso alle tabelle per SQL e Python (beta)

8 giugno 2021

Il controllo di accesso alle tabelle consente di concedere e revocare l'accesso ai dati a livello di codice usando il modello di controllo di accesso basato sulla visualizzazione di Azure Databricks. Il controllo di accesso alle tabelle è disponibile in due versioni: solo SQL e Python e SQL. In precedenza era disponibile a livello generale solo il controllo di accesso alle tabelle solo SQL. Ora è disponibile a tutti il controllo di accesso alle tabelle Python e SQL. Vedere Abilitare il controllo di accesso alle tabelle del metastore Hive in un cluster (legacy).

L’interfaccia utente e l’API dei processi mostrano ora il proprietario di un’esecuzione del processo

2-7 giugno 2021: versione 3.47

L'interfaccia utente e l'API dei processi includono ora l'utente che verrà eseguito come processo, semplificando la comprensione, il debug e il controllo delle autorizzazioni per il processo. Si tratta di un valore di sola lettura impostato sull'autore del processo se il controllo di accesso al processo è disabilitato o l'autorizzazione is_owner del processo se il controllo di accesso al processo è abilitato. Per ulteriori informazioni sulla gestione delle autorizzazioni dei processi, vedere Controllare l'accesso a un processo.

Proteggere le proprietà di configurazione sensibili di Spark e le variabili d'ambiente mediante i segreti (anteprima pubblica)

7 giugno 2021

possibile proteggere le proprietà di configurazione sensibili di Spark e le variabili di ambiente utilizzando i segreti. I segreti recuperati vengono elaborati dall'output del notebook e dai log del driver Spark e dell'executor. Vedere Segreti.

Se attualmente si usano password in testo non crittografato in una configurazione Spark, Databricks consiglia di ruotare le password e di usare i percorsi segreti nella configurazione di Spark.

Repos for Git è abilitato per impostazione predefinita nelle aree di lavoro nuove ed esistenti in alcune aree

2 giugno 2021

Questa nota sulla versione è stata aggiornata il 30 giugno 2021.

Per le nuove aree di lavoro e per le aree di lavoro esistenti con Notebook Git Versioning abilitato, Repos for Git è ora abilitato per impostazione predefinita in alcune aree. L'abilitazione predefinita dei repository verrà implementata in più aree nei prossimi mesi. Per informazioni su come abilitare o disabilitare personalmente Repos e verificare le impostazioni per l'area di lavoro, vedere Integrazione Git per le cartelle Git di Databricks.

Interfaccia utente delle impostazioni dell’area di lavoro riprogettata

2-7 giugno 2021: versione 3.47

La nuova scheda Impostazioni area di lavoro nella Console di amministrazione sostituisce le schede Archiviazione dell'area di lavoro, Elenchi Controllo di accesso e Avanzate e offre una configurazione semplificata dell'area di lavoro.

Aggiornamenti ai token scaduti per le query di database ListTokens e ListAllTokens

2-7 giugno 2021: versione 3.47

Le query di database ListTokens o ListAllTokens non restituiscono più token scaduti. Vengono restituiti token indefiniti (quelli con expiryTime impostato su -1).

Conferma ora necessaria quando si concedono o revocano le autorizzazioni di amministratore

2-7 giugno 2021: versione 3.47

Viene visualizzata una finestra di dialogo di conferma quando un utente amministratore concede o revoca privilegi di amministratore nell'interfaccia utente Web.

Modifiche ai tasti di scelta rapida nell’interfaccia utente Web

2-7 giugno 2021: versione 3.47

In un notebook, il modo per aprire l'elenco dei tasti di scelta rapida è cambiato. Per aprire l'elenco, cliccare l'icona Icona tastiera.