Cláusula CLUSTER BY (TABLE)

Aplica-se a:verificação marcada como sim SQL do Databricks verificação marcada como sim Databricks Runtime 13.3 LTS e versões posteriores verificação marcada como sim Somente Delta Lake

Define o clustering líquido, multidimensional para uma tabela do Delta Lake.

Você pode usar esta cláusula quando:

  • Criar uma tabela usando CREATE TABLE
  • Alterar uma tabela com ALTER TABLE para alternar as colunas de clustering. Para agrupar linhas com colunas de clustering alteradas, você deve executar OPTIMIZE. Observe que as linhas agrupadas por colunas de clustering anteriores não são afetadas.

As linhas atualizadas não são reagrupadas automaticamente. Execute OPTIMZE para reagrupar as linhas atualizadas.

Para obter mais informações sobre clustering líquido, consulte Usar clustering líquido para tabelas Delta

Sintaxe

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Parâmetros

  • column_name

    Especifica as colunas da tabela pelas quais os dados serão agrupados. A ordem da coluna não importa. Para se beneficiar da alteração do clustering, execute OPTIMIZE.

  • NONE

    Desativa o clustering para a tabela que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados por OPTIMIZE. Para não usar clustering ao criar uma tabela, omita a cláusula CLUSTER BY.

Exemplos

Você pode encontrar mais exemplos em Usar clustering líquido para tabelas Delta.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;