Enriquecer tabelas do Delta Lake com metadados personalizados

A Databricks recomenda sempre fornecer comentários para tabelas e colunas em tabelas. Você pode gerar esses comentários usando IA. Confira Adicionar comentários gerados por IA a objetos do Catálogo do Unity.

O Catálogo do Unity também oferece a capacidade de marcar dados. Consulte Aplicar marcas a objetos protegíveis do Catálogo do Unity.

Você também pode registrar mensagens para confirmações individuais em tabelas em um campo no log de transações do Delta Lake.

Configurar metadados de confirmação definidos pelo usuário

Você pode especificar cadeias de caracteres definidas pelo usuário como metadados em confirmações, usando a opção DataFrameWriter userMetadata ou a configuração SparkSession spark.databricks.delta.commitInfo.userMetadata. Se ambas foram especificadas, a opção tem preferência. Esses metadados definidos pelo usuário podem ser lidos na operação DESCRIBE HISTORY. Confira Trabalhar com o histórico de tabelas do Delta Lake.

SQL


SET spark.databricks.delta.commitInfo.userMetadata=some-comment
INSERT OVERWRITE target_table SELECT * FROM data_source

Python

df.write \
  .mode("overwrite") \
  .option("userMetadata", "some-comment") \
  .table("target_table")

Scala

df.write
  .mode("overwrite")
  .option("userMetadata", "some-comment")
  .table("target_table")