Eventi
Ottieni gratuitamente la certificazione in Microsoft Fabric.
19 nov, 23 - 10 dic, 23
Per un periodo di tempo limitato, il team della community di Microsoft Fabric offre buoni per esami DP-600 gratuiti.
Prepara oraQuesto browser non è più supportato.
Esegui l'aggiornamento a Microsoft Edge per sfruttare i vantaggi di funzionalità più recenti, aggiornamenti della sicurezza e supporto tecnico.
Si applica a: Databricks SQL Databricks Runtime
Ottimizza il layout dei dati Delta Lake. Facoltativamente, ottimizzare un subset di dati o collocare i dati per colonna. Se non si specifica la collocazione e la tabella non è definita con il clustering liquido, viene eseguita l'ottimizzazione della compressione bin.
OPTIMIZE table_name [FULL] [WHERE predicate]
[ZORDER BY (col_name1 [, ...] ) ]
Nota
Nota
Durante l'uso di Databricks Runtime, per controllare le dimensioni del file di output, impostare la configurazione spark.databricks.delta.optimize.maxFileSize
di Spark. Il valore predefinito è 1073741824
, che imposta le dimensioni su 1 GB. Se si specifica il valore 104857600
, le dimensioni del file vengono impostate su 100 MB.
Identifica una tabella Delta esistente. Il nome non deve includere una specifica temporale o una specifica delle opzioni.
FULL
Si applica a: Databricks Runtime 16.0 e versioni successive
Ottimizzare l'intera tabella, inclusi i dati che potrebbero essere stati in precedenza raggruppati. Questa clausola può essere specificata solo per le tabelle che usano clustering liquido.
WHERE
Ottimizzare il subset di righe corrispondenti al predicato di partizione specificato. Sono supportati solo i filtri che coinvolgono gli attributi della chiave di partizione.
Non è possibile utilizzare questa clausola nelle tabelle che usano clustering liquido.
ZORDER BY
Collocare le informazioni sulle colonne nello stesso set di file.
La co-località viene usata dagli algoritmi di data-skipping di Delta Lake per ridurre drasticamente la quantità di dati che devono essere letti.
È possibile specificare più colonne per ZORDER BY
come elenco delimitato da virgole.
Tuttavia, l'efficacia della località diminuisce con ogni colonna aggiuntiva.
Non è possibile utilizzare questa clausola nelle tabelle che usano clustering liquido.
> OPTIMIZE events;
> OPTIMZIE events FULL;
> OPTIMIZE events WHERE date >= '2017-01-01';
> OPTIMIZE events
WHERE date >= current_timestamp() - INTERVAL 1 day
ZORDER BY (eventType);
Per altre informazioni sul comando, vedere Ottimizzare il layout dei OPTIMIZE
file di dati.
Eventi
Ottieni gratuitamente la certificazione in Microsoft Fabric.
19 nov, 23 - 10 dic, 23
Per un periodo di tempo limitato, il team della community di Microsoft Fabric offre buoni per esami DP-600 gratuiti.
Prepara ora