Tutorial do Lakehouse: criar um lakehouse, ingerir dados de exemplo e criar um relatório

Nesse tutorial, você cria um lakehouse, ingere dados de exemplo na tabela Delta, aplica a transformação quando necessário e, em seguida, cria relatórios.

Pré-requisitos

Criar um lakehouse

  1. Em Power BI, selecione Espaços de trabalho no menu à esquerda.

  2. Para abrir seu workspace, insira seu nome na caixa de texto de pesquisa localizada na parte superior e selecione-o nos resultados da pesquisa.

  3. No comutador localizado na parte inferior esquerda, selecione Engenharia de Dados.

    Captura de tela mostrando onde selecionar o comutador e a engenharia de dados.

  4. Na tela Engenharia de Dados, selecione Lakehouse para criar um lakehouse.

  5. Na caixa de diálogo Novo lakehouse, insira wwilakehouse no campo Nome .

    Captura de tela da caixa de diálogo Nova lakehouse.

  6. Selecione Criar para criar e abrir o novo lakehouse.

Ingerir dados de exemplo

Observação

Se você não tiver o OneDrive configurado, inscreva-se na avaliação gratuita do Microsoft 365: Avaliação gratuita - Experimente o Microsoft 365 por um mês.

  1. Baixe o arquivo dimension_customer.csv do repositório de exemplos do Fabric.

  2. Na guia Início, em Obter dados no lakehouse, você verá as opções para carregar dados no lakehouse. Selecione Novo Fluxo de Dados Gen2.

    Captura de tela mostrando onde selecionar a opção New Dataflow Gen2 para carregar dados em sua casa do lago.

  3. No novo painel de fluxo de dados, selecione Importar de um arquivo de texto ou CSV.

  4. No painel Conectar-se à fonte de dados, selecione o botão de opção Carregar arquivo. Arraste e solte o arquivo dedimension_customer.csv que você baixou na etapa 1. Depois que o arquivo for carregado, selecione Avançar.

    Captura de tela mostrando onde selecionar Carregar arquivo e onde arrastar o arquivo baixado anteriormente.

  5. Na página Visualizar dados do arquivo , visualize os dados e selecione Criar para continuar e retornar à tela de fluxo de dados.

  6. No painel Configurações de Consulta, atualize o campo Nome como dimension_customer.

    Observação

    O Fabric adiciona um espaço e um número no final do nome da tabela por padrão. Os nomes de tabela devem ser minúsculos e não devem conter espaços. Renomeie-o adequadamente e remova todos os espaços do nome da tabela.

    Captura de tela do painel de configurações de consulta, mostrando onde inserir o nome e selecionar o destino dos dados.

  7. Neste tutorial, você associou os dados do cliente a um lakehouse. Caso queira adicionar outros itens de dados ao lakehouse, poderá adicioná-los desta forma:

    1. Nos itens de menu, selecione Adicionar destino de dados e selecione Lakehouse. Na tela Conectar-se ao destino de dados, entre em sua conta, se necessário, e selecione Avançar.

    2. Navegue até o wwilakehouse em seu workspace.

    3. Se a tabela dimension_customer não existir, selecione a configuração Nova tabela e insira o nome da tabela dimension_customer. Se a tabela já existir, selecione a configuração Tabela existente e escolha dimension_customer na lista de tabelas no pesquisador de objetos. Selecione Avançar.

      Captura de tela mostrando como escolher a tabela de destino.

    4. No painel Escolher configurações de destino , selecione Substituir como Método de atualização. Selecione Salvar configurações para retornar à tela de fluxo de dados.

  8. Na tela de fluxo de dados, você pode transformar facilmente os dados com base em seus requisitos de negócios. Para simplificar, não estamos fazendo nenhuma alteração neste tutorial. Para continuar, selecione Publicar na parte inferior direita da tela.

    Captura de tela do painel de configuração de consulta que contém o botão Publicar.

  9. Um círculo giratório ao lado do nome do fluxo de dados indica que a publicação está em andamento na exibição do item. Quando a publicação for concluída, selecione ... e selecione Propriedades. Renomeie o fluxo de dados para Carregar Tabela do Lakehouse e selecione Salvar.

  10. Selecione a opção Atualizar agora ao lado do nome do fluxo de dados para atualizar o fluxo de dados. Essa opção executa o fluxo de dados e move os dados do arquivo de origem para a tabela do lakehouse. Enquanto estiver em andamento, você verá um círculo giratório em Coluna atualizada no modo de exibição de item.

    Captura de tela mostrando onde encontrar o ícone Atualizar agora.

  11. Depois que o fluxo de dados for atualizado, selecione o novo lakehouse na barra de navegação esquerda para exibir a tabela Delta dimension_customer.

    Captura de tela do painel de navegação no qual o lakehouse é aberto.

  12. Selecione a tabela para visualizar seus dados. Você também pode usar o ponto de extremidade de análise do SQL do lakehouse para consultar os dados com instruções SQL. Selecione Ponto de extremidade de análise do SQL no menu suspenso Lakehouse na parte superior direita da tela.

    Captura de tela da tabela delta, mostrando onde selecionar o ponto de extremidade de análise SQL.

  13. Selecione a tabela dimension_customer para visualizar seus dados ou selecione Nova consulta SQL para gravar suas instruções SQL.

    Captura de tela da tela do ponto de extremidade de análise SQL, mostrando onde selecionar a Nova consulta SQL.

  14. A consulta de exemplo a seguir agrega a contagem de linhas com base na coluna BuyingGroup da tabela dimension_customer . Os arquivos de consulta SQL são salvos automaticamente para referência futura e você pode renomear ou excluir esses arquivos com base em sua necessidade.

    Para executar o script, selecione o ícone Executar na parte superior do arquivo de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Criar um relatório

  1. Anteriormente, todas as tabelas e exibições do lakehouse eram adicionadas automaticamente ao modelo semântico. Com as atualizações recentes para novos lakehouses, você precisa adicionar manualmente as tabelas ao modelo semântico. Abra seu lakehouse e alterne para a exibição do ponto de extremidade de análise SQL. Na guia Relatórios, selecione Gerenciar modelo semântico padrão e selecione as tabelas que deseja adicionar ao modelo semântico. Nesse caso, selecione a tabela dimension_customer.

    Captura de tela de onde você pode selecionar as tabelas a serem adicionadas ao modelo semântico.

  2. Para garantir que as tabelas no modelo semântico sempre estejam sincronizadas, alterne para o modo de exibição de Ponto de extremidade de análise SQL e abra o painel de configurações do lakehouse. Selecione a configuração Modelo semântico padrão do Power BI e ative Sincronizar o modelo semântico padrão do Power BI. Para obter mais informações, confira Modelos semânticos padrão do Power BI.

    Captura de tela mostrando como ativar a sincronização de dados com o modelo semântico padrão

  3. Após a adição da tabela, o Fabric criará um modelo semântico com o mesmo nome do lakehouse.

    Captura de tela mostrando o modelo semântico padrão que foi criado após a criação do novo lakehouse.

  4. No painel do modelo semântico, você pode exibir todas as tabelas. Você tem opções para criar relatórios do zero, relatório paginado ou permitir que o Power BI crie automaticamente um relatório com base em seus dados. Para este tutorial, selecione Explorar estes dados em Criar um relatório automaticamente. No próximo tutorial, criamos um relatório do zero.

    Captura de tela da página de detalhes do modelo semântico, mostrando onde selecionar Criar um relatório.

  5. Como a tabela é uma dimensão e não há medidas nela, o Power BI cria uma medida para a contagem de linhas, a agrega em diferentes colunas e cria gráficos diferentes, conforme mostrado na imagem a seguir. Você pode salvar este relatório para o futuro selecionando Salvar na faixa de opções superior. Você pode fazer mais alterações neste relatório para atender aos seus requisitos, incluindo ou excluindo outras tabelas ou colunas.

    Captura de tela de uma página de resumo rápido exibindo quatro gráficos de barras diferentes.

Próxima etapa