Imposição de esquema

O Azure Databricks valida a qualidade dos dados aplicando o esquema na gravação.

Observação

Este artigo descreve o comportamento padrão das tabelas no Azure Databricks, que são apoiadas pelo Delta Lake. A imposição de esquema não se aplica a tabelas apoiadas por dados externos.

Imposição de esquema para operações de inserção

O Azure Databricks impõe as seguintes regras ao inserir dados em uma tabela:

  • Todas as colunas inseridas precisam existir na tabela de destino.
  • Todos os tipos de dados da coluna precisam corresponder aos tipos de dados de coluna na tabela de destino.

Observação

O Azure Databricks tenta converter tipos de dados de coluna com segurança para corresponder à tabela de destino.

Validação de esquema durante operações de MERGE

O Azure Databricks impõe as seguintes regras ao inserir ou atualizar dados como parte de uma operação de MERGE:

  • Se o tipo de dados na instrução de origem não corresponder à coluna de destino, MERGE tenta converter tipos de dados de coluna com segurança para corresponder à tabela de destino.
  • As colunas que são o destino de uma ação UPDATE ou INSERT devem existir na tabela de destino.
  • Ao usar a sintaxe INSERT * ou UPDATE SET *:
    • As colunas no conjunto de dados de origem não presentes na tabela de destino são ignoradas.
    • O conjunto de dados de origem deve ter todas as colunas presentes na tabela de destino.

Modificar um esquema de tabela

Você pode atualizar o esquema de uma tabela usando instruções ALTER TABLE explícitas ou evolução automática do esquema. Confira Atualizar o esquema de tabela do Delta Lake.

A evolução do esquema tem semântica especial para operações de MERGE. Confira Evolução automática de esquema para mesclagem do Delta Lake.