Adicionar comentários gerados por IA a objetos do Unity Catalog

Este artigo apresenta comentários de objeto e coluna de tabela do Unity Catalog gerados por IA (também conhecidos como documentação gerada por IA), explica como eles funcionam, mostra como adicioná-los e editá-los e responde a perguntas frequentes.

Objetos suportados

Comentários gerados por IA são suportados para os seguintes objetos do Unity Catalog:

  • Catálogos
  • Esquemas
  • Tabelas
  • Colunas de tabela
  • Funções
  • Modelos
  • Volumes

Os comentários gerados por IA não suportam visualizações ou visualizações materializadas.

Como funcionam os comentários gerados por IA?

Como proprietário de um objeto ou um usuário com permissão para modificar um objeto, você pode usar o Catalog Explorer para exibir e adicionar um comentário gerado por IA para objetos e colunas de tabela gerenciados pelo Unity Catalog. Os comentários são alimentados por um modelo de linguagem grande (LLM) que leva em conta metadados de objeto, como o esquema de tabela e nomes de coluna.

Os comentários gerados por IA fornecem uma maneira rápida de ajudar os usuários a descobrir dados gerenciados pelo Unity Catalog.

Importante

Os comentários gerados por IA destinam-se a fornecer uma descrição geral de objetos e colunas de tabela com base no esquema. As descrições são ajustadas para dados em um contexto empresarial e empresarial, usando esquemas de exemplo de vários conjuntos de dados abertos em vários setores. O modelo foi avaliado com centenas de amostras simuladas para verificar se evita gerar descrições prejudiciais ou inadequadas.

Os modelos de IA nem sempre são precisos e os comentários devem ser revisados antes de salvar. A Databricks recomenda fortemente a revisão humana dos comentários gerados por IA para verificar se há imprecisões. O modelo não deve ser usado para tarefas de classificação de dados, como a deteção de colunas com PII.

Para exibir comentários depois que eles forem adicionados, você deve ter o SELECT privilégio no objeto, USE SCHEMA no esquema pai e USE CATALOG no catálogo pai.

Para obter informações sobre os modelos usados para gerar sugestões de comentários, consulte Perguntas frequentes sobre comentários gerados por IA.

Antes de começar

Antes de poder usar comentários gerados por IA, um administrador de espaço de trabalho deve habilitar os recursos assistenciais baseados em serviços de IA do Azure:

  1. Em Configurações, vá para a guia Avançado e role para baixo até a seção Outros.
  2. Ative a opção de recursos auxiliares de IA baseados em serviços de IA do Azure.

Adicionar comentários gerados por IA

Você deve usar o Gerenciador de Catálogos para exibir comentários sugeridos, editá-los e adicioná-los a objetos e colunas de tabela.

Permissões necessárias: você deve ser o proprietário do objeto ou ter o MODIFY privilégio no objeto para exibir o comentário sugerido pela IA, editá-lo e adicioná-lo.

Adicionar um comentário sugerido por IA a um objeto

  1. No seu espaço de trabalho do Azure Databricks, clique em Ícone do catálogo Catálogo.

  2. Pesquise ou procure o objeto e selecione-o.

  3. No painel Sobre isso<object>, clique em AI generate.

    Botão de comentários gerados por IA

    A IA pode demorar um pouco para gerar o comentário.

  4. Clique em Aceitar para aceitar o comentário no estado em que se encontra ou em Editar para modificá-lo antes de salvá-lo.

Adicionar um comentário sugerido por IA a uma coluna de tabela

  1. No seu espaço de trabalho do Azure Databricks, clique em Ícone do catálogo Catálogo.

  2. Pesquise ou procure a tabela e selecione-a.

  3. Acima dos cabeçalhos das colunas da tabela, clique em AI generate.

    Um comentário é gerado para cada coluna.

  4. Clique na marca de seleção ao lado do comentário da coluna para aceitá-lo ou fechá-lo sem salvo.

Atualizar um comentário gerado por IA

O proprietário do objeto ou usuário com o MODIFY privilégio no objeto pode atualizar comentários a qualquer momento, usando a interface do usuário do Catalog Explorer. O assistente de chat embutido ajuda a editar comentários, fornecendo opções para Encurtar texto ou Traduzir texto para um idioma diferente.

Assistente inline de comentários gerados por IA

Você também pode usar ALTER ou COMENTAR EM SQL comandos.

Perguntas frequentes sobre comentários gerados por IA

Esta seção fornece informações gerais sobre comentários gerados por IA (também conhecidos como documentação gerada por IA) na forma de perguntas frequentes.

Quais serviços o recurso de documentação gerada por IA usa?

Os comentários gerados por IA usam um modelo interno de linguagem grande (LLM) para tabelas e colunas. Eles podem usar parceiros de modelo externos para outros objetos do Catálogo Unity e o assistente embutido. Os dados enviados para serviços externos não são usados para treinamento de modelos. Os modelos em si são sem monitoração de estado: nenhum prompt ou conclusão é armazenado pelos provedores de modelo.

Em quais regiões os pontos de extremidade de serviço de modelo estão hospedados?

Para espaços de trabalho da União Europeia (UE), os recursos de assistência à IA usam um modelo externo hospedado na UE. Todas as outras regiões usam um modelo hospedado nos EUA.

Como os dados são criptografados entre o Azure Databricks e os serviços de IA do Azure?

O tráfego entre o Databricks e os serviços de IA do Azure é criptografado em trânsito usando a criptografia TLS 1.2 padrão do setor.

Tudo está encriptado em repouso?

Todos os dados armazenados em um espaço de trabalho do Azure Databricks são criptografados com AES-256 bits. Os nossos parceiros externos não armazenam quaisquer avisos ou conclusões que lhes sejam enviadas.

Que dados são enviados para os modelos?

O Azure Databricks envia os seguintes metadados para os modelos com cada solicitação de API:

  • Catálogo (nome do catálogo, comentário atual, tipo de catálogo)
  • Esquema (nome do catálogo, nome do esquema, comentário atual)
  • Tabela (nome do catálogo, nome do esquema, nome da tabela, comentário atual)
  • Função (nome do catálogo, nome do esquema, nome da função, comentário atual, parâmetros, definição)
  • Modelo (nome do catálogo, nome do esquema, nome do modelo, comentário atual, aliases)
  • Volume (nome do catálogo, nome do esquema, nome do volume, comentário atual)
  • Nomes de colunas (nome da coluna, tipo, chave primária ou não, comentário da coluna atual)

Os comentários aprovados são armazenados no banco de dados do plano de controle do Azure Databricks, juntamente com o restante dos metadados do Catálogo Unity. O banco de dados do plano de controle é criptografado com AES-256 bits.

O uso é regido pelos termos e condições existentes do Azure Databricks com os quais o cliente concordou ao usar o Azure Databricks.