O que é um espaço Genie de IA/BI?

Importante

Esse recurso está em uma versão prévia. Se o Assistente do Databricks estiver habilitado no nível da conta, os administradores do workspace poderão habilitar esse recurso na página Versões prévias. Consulte Gerenciar Versões Prévias do Azure Databricks.

O AI/BI Genie é uma interface no-code do DatabricksIQ que permite aos usuários empresariais realizar análises de dados de por conta própria usando linguagem natural. Especialistas na área, como analistas de dados, configuram espaços do Genie com conjuntos de dados, consultas de exemplo e diretrizes de texto para ajudar o Genie a traduzir perguntas de negócios em consultas analíticas. Após a configuração, os usuários empresariais podem fazer perguntas e gerar visualizações para entender os dados operacionais. O Genie atualiza continuamente sua base semântica à medida que seus dados são alterados e os usuários fazem novas perguntas. Consulte Recursos com tecnologia DatabricksIQ.

Os analistas de dados podem preparar uma experiência de espaço Genie específica do domínio para usuários de negócios fazendo o seguinte:

  • Selecionando tabelas relevantes do Catálogo do Unity e expondo seus metadados (descrições de tabela e coluna) no espaço Genie.
  • Adicionando instruções que transferem informações específicas da organização (lógica de negócios e metadados) para o espaço Genie.

Após a configuração inicial, o usuário pode melhorar incrementalmente a compreensão do Genie sobre seus dados e a semântica ao longo do tempo, salvando respostas SQL verificadas como instruções. Confira Fornecer instruções.

Casos de uso de exemplo

Você pode criar diferentes espaços do Genie para atender a vários públicos não técnicos. Os cenários a seguir descrevem dois possíveis casos de uso.

Visualizar o status da oportunidade

Um gerente de vendas deseja obter o status atual de oportunidades abertas e fechadas por etapa em seu pipeline de vendas. Eles podem interagir com o espaço do Genie usando a linguagem natural e gerar automaticamente uma visualização.

O gif a seguir mostra essa interação:

Gif com pergunta de exemplo, resposta e visualização gerada automaticamente

Acompanhamento de logística

Uma empresa de logística deseja usar espaços Genie para ajudar usuários empresariais de diferentes departamentos a acompanhar detalhes operacionais e financeiros. Eles criaram um espaço Genie para seus gerentes de instalações de remessa para acompanhar os embarques e outro para seus executivos financeiros entenderem sua saúde financeira.

Como as respostas de espaço Genie são geradas?

Os espaços Genie geram respostas a perguntas de linguagem natural usando nomes e descrições de tabelas e colunas. Os dados reais nas tabelas permanecem ocultos do Genie.

O AI/BI Genie usa os nomes e descrições para converter perguntas de linguagem natural em uma consulta SQL equivalente. Em seguida, ele responde com os resultados dessa consulta como uma tabela. Os autores de espaço do Genie e os usuários empresariais podem inspecionar a consulta SQL gerada que produz cada resposta.

Requisitos técnicos

  • Os espaços Genie usam dados registrados no Catálogo do Unity.
  • Os espaços do Genie exigem um warehouse SQL pro ou sem servidor.
  • Cada workspace pode ter até 1.000 espaços Genie.

Permissões necessárias

As permissões a seguir são necessárias para criar, editar e usar espaços do Genie.

Observação

Configurar dados e acesso de computação requer permissões elevadas geralmente restritas a um administrador. Consulte Criar um SQL warehouse e Gerenciar privilégios no Catálogo do Unity.

  • Permissões de computação: criadores, editores e usuários exigem o acesso CAN USE ao SQL Warehouse padrão designado para o espaço. Os autores selecionam o SQL warehouse padrão quando criam um espaço. O autor pode selecionar qualquer SQL warehouse para o qual eles têm permissões CAN RUN.
  • Permissões de acesso a dados: qualquer usuário que interage com o espaço precisa de pelo menos privilégios SELECT nos dados usados em um espaço.
  • Permissões de espaço do Genie: os usuários precisam de permissões CAN RUN no espaço do Genie para interagir com o Genie e os dados usados no espaço. Confira ACLs de espaço do Genie para obter um mapeamento completo de privilégios e habilidades para um espaço do Genie.

Quais dados devo usar?

Você pode criar novos espaços Genie com base em uma ou mais tabelas gerenciadas do Catálogo do Unity. O AI/BI Genie usa os metadados anexados aos objetos do Catálogo do Unity para gerar respostas. Conjuntos de dados bem anotados, emparelhados com instruções específicas que você fornece, são fundamentais para criar uma experiência positiva para os usuários finais.

O Azure Databricks recomenda o seguinte:

  • Coletar dados para consumo analítico: exibições de camada para reduzir o número de colunas e adicionar informações específicas do caso de uso para aumentar a qualidade da resposta.
  • Minimizar o número de tabelas e colunas em um espaço do Genie: traga apenas as tabelas e colunas necessárias para responder perguntas de um determinado domínio. Tabelas ou colunas desnecessárias podem fazer com que o Genie forneça respostas confusas ou incorretas ou exiba uma mensagem de erro.

Criar um novo espaço Genie

Caixa de diálogo Novo espaço, conforme descrito na lista a seguir.

Quando você cria um novo espaço do Genie, uma caixa de diálogo Novo espaço mostra as seguintes opções:

  • Título: O título aparece no navegador do workspace com outros objetos de workspace. Escolha um título que ajudará os usuários finais a descobrir o espaço Genie.
  • Descrição: os usuários veem a descrição quando abrem o espaço Genie. Use essa área de texto para descrever a finalidade dos espaços.
  • Warehouse padrão: esse recurso de computação alimenta as instruções SQL geradas nos espaços Genie. Os usuários finais precisam de acesso a esse warehouse para interagir com o espaço. Um espaço Genie pode usar um Pro ou SQL warehouse profissional sem servidor. Para um desempenho ideal, o Databricks recomenda usar um SQL Warehouse sem servidor.
  • Tabelas: os espaços Genie podem ser baseados em uma ou mais tabelas. No máximo, você pode incluir 25 tabelas. O botão Adicionar tabelas abre uma nova caixa de diálogo na qual você pode selecionar as tabelas do Catálogo do Unity que deseja incluir.
  • Perguntas de exemplo: perguntas de exemplo são opcionais. Eles aparecem em chats para fornecer exemplos dos tipos de perguntas que os usuários podem fazer. Elas podem ser adicionadas durante a criação ou posteriormente nas Configurações do espaço.

Chat no espaço Genie

A maioria das interações de espaço do Genie ocorre na janela de chat.

Nova janela de chat, conforme descrito no texto a seguir.

Uma nova janela de chat inclui um conjunto selecionado de perguntas de exemplo. Essas perguntas de exemplo ajudam os usuários a entender quais perguntas podem fazer ao espaço do Genie. O campo de texto, em que os usuários insere perguntas, fica próximo à parte inferior da tela.

As respostas aparecem acima do campo de texto. Depois que um usuário insere uma pergunta, ela é salva em um thread de histórico de chat no painel esquerdo.

Histórico de chat

Os threads de histórico de chat são salvos para cada usuário para que eles possam se referir a perguntas e respostas anteriores. Os usuários também podem reenviar ou revisar perguntas de um thread de chat. O botão Novo chat no painel esquerdo inicia um novo thread.

Cada thread de chat mantém seu contexto, de modo que o Assistente considere as perguntas anteriores que foram feitas. Isso permite que os usuários façam perguntas de acompanhamento para explorar ou concentrar novamente um conjunto de resultados.

Estrutura de resposta

A estrutura de resposta precisa varia de acordo com a pergunta. Muitas vezes, as respostas incluem uma explicação de linguagem natural e uma tabela mostrando o conjunto de resultados pertinente. Todas as respostas incluem a consulta SQL gerada para responder à pergunta. Clique em Mostrar código gerado para exibir a consulta gerada.

O lado inferior direito da resposta inclui ações opcionais. Você pode copiar o CSV de resposta para sua área de transferência, baixá-lo como um arquivo CSV, adicioná-lo como uma instrução para o espaço Genie e votar a favor ou contra da resposta.

Um conjunto de blocos de Ações rápidas segue respostas que incluem dados tabulares. Você pode usá-las para gerar visualizações.

Blocos de ação rápida que sugerem diferentes opções de visualização.

Você também pode gerar uma visualização descrevendo-a em palavras após obter um resultado de consulta.

Fornecer comentários de resposta

Cada resposta do AI/BI Genie inclui um botão de comentários de polegar para cima ou para baixo. O Databricks recomenda incentivar os usuários a fornecer comentários sobre o espaço usando esse mecanismo. Os feedbacks podem ser usados para ajustar as respostas e iterar em seu espaço. Acesse esse recurso por meio da página Monitoramento. Consulte Monitorar o espaço.

Monitorar o espaço

Um espaço do Genie deve ser uma ferramenta de colaboração contínua para equipes de dados e usuários empresariais acumularem conhecimento, não uma implantação única. Entender as novas perguntas às quais os usuários empresariais precisam de respostas é essencial para a criação de conhecimento. A página Monitoramento permite que você veja perguntas e respostas individuais, bem como feedbacks de polegar para cima ou para baixo fornecidos pelos usuários que trabalham com o espaço. Clique em Ícone de monitoramento Monitoramento na barra lateral do espaço do Genie para abrir a página de monitoramento.

Uma página de monitoramento de exemplo mostrando os recursos descritos.

A página Monitoramento mostra todas as perguntas e respostas que foram feitas no espaço. Você pode filtrar perguntas por tempo, classificação, usuário ou status. Monitorar o espaço pode ajudar os autores do Genie a entender proativamente as consultas levantadas pelos usuários empresariais e como o espaço do Genie respondeu.

Ao identificar as perguntas com as quais o Genie tem dificuldades, você pode atualizar o espaço do Genie com instruções específicas para melhorar suas respostas. Clique em uma pergunta para abrir o texto da pergunta e da resposta. Você também pode acessar a conversa de chat completa nessa exibição.

Fornecer instruções

As instruções ajudam a orientar as respostas do Genie para que ele possa processar o jargão, a lógica e os conceitos específicos de uma determinada área. Você pode escrever instruções como consultas de exemplo ou trechos de texto sem formatação que ajudam o Genie a responder perguntas que os usuários do espaço provavelmente perguntarão. Instruções abrangentes são essenciais para uma experiência de espaço perfeita e intuitiva Genie.

Clique emícone de instruções Instruções na barra lateral do espaço do Genie para abrir o painel de instruções.

Painel de Instruções

Os exemplos a seguir ilustram vários tipos de instruções:

  • Informações comerciais específicas da empresa:

    • "Nosso ano fiscal começa em fevereiro"
  • Valores, aliases ou filtros comuns:

    • "Sempre converta em letras minúsculas e use um operador semelhante ao aplicar filtros."
    • "Use abreviações para estados em valores de filtro."
  • Funções definidas pelo usuário disponíveis por meio do Catálogo do Unity:

    • "Para trimestres, use a UDF adventureworks.oneb.get_quarter(date). A saída de get_quarter é o trimestre e é de 1,2,3 ou 4. Use isso para filtrar os dados conforme necessário.

      Por exemplo, para o trimestre 3, use onde adventureworks.oneb.get_quarter(posted_date)= 3"`"

  • Amostra de consultas SQL:

    • Você pode fornecer amostras de consultas que espera que o Genie gere.
    • Concentre-se em fornecer exemplos que realçam a lógica que é exclusiva para sua organização e dados, como no exemplo a seguir:
    -- Return our current total open pipeline by region.
    -- Opportunities are only considered pipelines if they are tagged as such.
    SELECT
      a.region__c AS `Region`,
      sum(o.amount) AS `Open Pipeline`
    FROM
      sales.crm.opportunity o
      JOIN sales.crm.accounts a ON o.accountid = a.id
    WHERE
      o.forecastcategory = 'Pipeline' AND
      o.stagename NOT ILIKE '%closed%'
    GROUP BY ALL;
    

Você pode organizar as instruções de espaço Genie como uma anotação longa ou agrupá-las por tópicos relacionados para uma melhor estrutura.

Limites de processamento de texto

Tokens são as unidades básicas de texto que o Genie usa para processar e compreender a linguagem. Por exemplo, o texto incluído como instruções e nos metadados é convertido em tokens. Cada espaço Genie tem um limite de tokens de aproximadamente 14.000 por pergunta. Esse limite inclui instruções, exemplos de instruções SQL, ativos confiáveis, metadados de tabelas (incluindo nomes de colunas, descrições, nomes de tabelas e definições de chave) e conversas de chat anteriores. Se o seu espaço Genie se aproximar ou exceder esse limite, o produto irá notificá-lo com avisos ou erros.

Para obter ajuda na solução desse erro, veja Solicitação não processada devido a um limite de token

Editar SQL gerado

Você pode analisar e editar o SQL gerado em qualquer resposta. Os autores do espaço Genie normalmente conhecem o domínio e os dados que lhes permitem reconhecer quando o Genie está gerando uma resposta incorreta. Frequentemente, os erros podem ser corrigidos com um pequeno ajuste manual na consulta SQL gerada. Para exibir o SQL gerado para qualquer resposta, clique em Mostrar código gerado para inspecionar a consulta.

Você pode editar a instrução SQL gerada para corrigi-la se tiver CAN EDIT ou privilégios superiores no espaço Genie. Depois de fazer suas correções, execute a consulta. Em seguida, você pode salvá-la como uma instrução para ensinar o Genie a responder no futuro. Para salvar a consulta editada, clique em Ícone Salvar como instrução Salvar como instrução.

Compartilhar um espaço Genie

Importante

Os usuários de espaço Genie devem interagir com os dados usando suas próprias credenciais. Perguntas sobre dados que não podem acessar geram respostas vazias.

Os usuários de espaço do Genie devem ter permissões CAN USE no warehouse associado a um espaço do Genie e permissões de acesso nos objetos do Catálogo do Unity exibidos no espaço. Confira Quais dados devo usar?.

Os novos espaços Genie são salvos na pasta do usuário por padrão. Assim como outros objetos de workspace, eles herdam permissões de sua pasta delimitada. Você pode usar a estrutura de pastas do workspace para compartilhá-las com outros usuários. Consulte Organizar objetos de workspace em pastas.

Você também pode especificar determinados usuários ou grupos com os quais compartilhar em um determinado nível de permissão: PODE GERENCIAR, PODE EDITAR, PODE EXECUTAR e PODE EXIBIR.

Para compartilhar com usuários ou grupos específicos:

  1. Clique em Compartilhar.
  2. Insira os usuários ou grupos com os quais deseja compartilhar o espaço. Em seguida, clique em Adicionar e defina os níveis de permissão adequados.
  3. Utilize o botão Copiar link na parte inferior da caixa de diálogo Compartilhar para obter um link compartilhável para o espaço Genie. Usuários privilegiados podem clicar no link para abrir o espaço Genie em uma nova aba e fazer perguntas.

Práticas recomendadas para preparação de espaço

  • Antes de construir, estabeleça um conjunto de perguntas bem definidas que você deseja que os usuários do espaço possam responder.
  • Teste o espaço Genie para verificar a qualidade da resposta. Tente o seguinte para ver se o modelo fornece a resposta esperada:
    • Reformular as perguntas fornecidas.
    • Faça outras perguntas relacionadas aos conjuntos de dados.
  • Adicione e refina as instruções de espaço Genie até que as perguntas forneçam a resposta esperada.

Para obter mais orientações sobre práticas recomendadas e ajuda na solução de problemas, veja Selecionar um espaço Genie eficaz