Tipi di SQL warehouse

Databricks SQL supporta i tipi di SQL warehouse seguenti:

  • Senza server
  • Pro
  • Classico

Ogni tipo di sql warehouse ha funzionalità di prestazioni diverse. La tabella seguente illustra le funzionalità delle prestazioni supportate da ogni tipo di sql warehouse.

Tipi di Warehouse Motore Photon I/O predittivo Gestione dei carichi di lavoro intelligente
Senza server X X X
Pro X X
Classico X

L'elenco seguente descrive ogni funzionalità delle prestazioni:

  • Photon: motore di query vettorializzato nativo in Databricks. Photon fa parte di un runtime ad alte prestazioni che esegue più velocemente le chiamate API SQL e DataFrame esistenti e riduce il costo totale per carico di lavoro.

  • IO predittivo: una suite di funzionalità per velocizzare le operazioni di analisi selettiva nelle query SQL. Le operazioni di I/O predittive possono offrire un'ampia gamma di velocità.

  • Gestione intelligente dei carichi di lavoro (IWM): set di funzionalità che migliorano la capacità di SQL Serverless di Databricks di elaborare un numero elevato di query in modo rapido e conveniente. Usando le tecniche di previsione e gestione dinamica basate sull'intelligenza artificiale, IWM garantisce che i carichi di lavoro abbiano rapidamente la giusta quantità di risorse. La differenza principale consiste nelle funzionalità di intelligenza artificiale in Databricks SQL per rispondere in modo dinamico alle richieste del carico di lavoro anziché usare soglie statiche.

    Nota

    Per i prezzi per ogni tipo di warehouse e un confronto dettagliato delle funzionalità, vedere Databricks SQL. Per informazioni sulle funzionalità più recenti di Databricks SQL, vedere Note sulla versione di Databricks SQL.

Differenze di prestazioni tra i diversi tipi di SQL warehouse

Ogni tipo di sql warehouse presenta caratteristiche di prestazioni diverse.

Warehouse SQL serverless

Usando l'architettura serverless di Azure Databricks, SQL warehouse serverless supporta tutte le funzionalità di prestazioni di Databricks SQL. Con un serverless SQL warehouse e le relative funzionalità di prestazioni, è possibile ottenere:

  • Tempo di avvio rapido (in genere compreso tra 2 e 6 secondi).
  • Scalabilità rapida per acquisire più calcolo quando necessario per mantenere bassa latenza.
  • Ammissione di query più vicina alla limitazione dell'hardware anziché alla macchina virtuale.
  • Ridimensionamento rapido per ridurre al minimo i costi quando la domanda è bassa, offrendo prestazioni coerenti con costi e risorse ottimizzati.

Per prestazioni di avvio ottimali, I/O più efficiente, gestione più intelligente della domanda di query che varia notevolmente nel tempo e scalabilità automatica rapida quando si verifica l'accodamento delle query, scegliere un serverless SQL warehouse. Vedere Ridimensionamento automatico serverless e accodamento delle query.

Un serverless SQL warehouse offre prestazioni elevate con questi tipi di carichi di lavoro:

  • ETL
  • Business Intelligence
  • Analisi esplorativa

Importante

I warehouse SQL non supportano il pass-through delle credenziali. Databricks consiglia di usare Unity Catalog per la governance dei dati. Vedere Cos'è Unity Catalog?.

Pro SQL warehouse

Un pro SQL warehouse supporta Photon e I/O predittivo, ma non supporta la gestione intelligente del carico di lavoro. Con pro SQL warehouse (a differenza di un serverless SQL warehouse), il livello di calcolo risiede nell'account di sottoscrizione Azure anziché nell’account di Azure Databricks. Di conseguenza, un pro SQL warehouse non supporta la gestione intelligente del carico di lavoro, rendendolo meno reattivo alla domanda di query che varia notevolmente nel tempo e non è in grado di ridimensionare automaticamente il più rapidamente possibile come un serverless SQL warehouse. L'avvio di un pro SQL warehouse richiede alcuni minuti (in genere circa 4 minuti) e aumenta e riduce la velocità di risposta rispetto a un serverless SQL warehouse. Vedere Accodamento e scalabilità automatica per i data warehouse SQL classici e pro.

Quando usare pro SQL warehouse:

  • I warehouse SQL serverless sono disponibili in anteprima pubblica.
  • È disponibile una rete personalizzata e si vuole connettersi ai database nella rete nel cloud o in locale per la federazione o un'architettura di tipo ibrido. Ad esempio, usare un pro SQL warehouse se si vogliono inserire altri servizi nella rete, ad esempio un bus di eventi o database, oppure si vuole connettere la rete alla rete locale.

Sql Warehouse classici

Un'istanza classica di SQL warehouse supporta Photon, ma non supporta la gestione predittiva di IO o del carico di lavoro intelligente. Con un classico SQL warehouse (a differenza del serverless SQL warehouse), il livello di calcolo risiede nell'account di sottoscrizione Azure anziché nell’account di Azure Databricks. Senza il supporto per la gestione predittiva di IO o di carico di lavoro intelligente, un sql warehouse classico offre solo prestazioni di livello di base e prestazioni inferiori rispetto a un serverless o a un data warehouse pro SQL. L'avvio di un'istanza classica di SQL warehouse richiede anche alcuni minuti (in genere circa 4 minuti) e aumenta e riduce la velocità di risposta rispetto a un serverless SQL warehouse. Vedere Accodamento e scalabilità automatica per i data warehouse SQL classici e pro.

Usare un sql warehouse classico per eseguire query interattive per l'esplorazione dei dati con le prestazioni di livello generale e le funzionalità SQL di Databricks.

Nota

Per informazioni sul ridimensionamento di SQL warehouse e sulla scalabilità del data warehouse SQL in risposta all'accodamento delle query, vedere Accodamento e scalabilità automatica per i data warehouse SQL pro e classici.

Quali sono le impostazioni predefinite per il tipo di Warehouse?

Per le aree di lavoro nelle aree che supportano i warehouse SQL serverless e soddisfano i requisiti:

  • Usando l'interfaccia utente, il tipo di data warehouse SQL predefinito è serverless.
  • Usando l'API SQL warehouses con parametri predefiniti, il tipo di warehouse SQL predefinito è classico. Per usare serverless, impostare il enable_serverless_compute parametro su true e impostare anche warehouse_type su pro. Se questa area di lavoro usa l'API sql warehouse per creare un warehouse tra il 1° novembre 2022 e il 19 maggio 2023 e soddisfa i requisiti per i warehouse SQL serverless, l'impostazione predefinita rimane impostata su true. Per evitare ambiguità, in particolare per le organizzazioni con molte aree di lavoro, Databricks consiglia di impostare sempre questo campo.
  • Se l'area di lavoro usa un metastore Hive esterno legacy, i warehouse SQL serverless non sono supportati. Il tipo di sql warehouse predefinito è uguale a se il calcolo serverless fosse disabilitato, che è pro nell'interfaccia utente e nella versione classica usando l'API. Per altre informazioni su Unity Catalog o altre opzioni, contattare anche il team dell'account di Azure Databricks.

Per le aree di lavoro che non supportano i warehouse SQL serverless:

  • Usando l'interfaccia utente, il tipo di sql warehouse predefinito è pro.
  • Usando l'API SQL warehouses con parametri predefiniti, il tipo di warehouse SQL predefinito è classico.