Modelagem dimensional no Microsoft Fabric Warehouse

Aplica-se a:✅ ponto de extremidade de análise SQL e Warehouse no Microsoft Fabric

Este artigo é o primeiro de uma série sobre modelagem dimensional dentro de um armazém. Ele fornece orientação prática para o Warehouse no Microsoft Fabric, que é uma experiência que oferece suporte a muitos recursos do T-SQL, como a criação de tabelas e o gerenciamento de dados em tabelas. Assim, você tem o controle total de criar suas tabelas de modelo dimensional e carregá-las com dados.

Nota

Neste artigo, o termo data warehouse refere-se a um data warehouse corporativo, que oferece integração abrangente de dados críticos em toda a organização. Em contraste, o termo autônomo de armazém refere-se a um Fabric Warehouse, que é uma oferta de banco de dados relacional de software como serviço (SaaS) que você pode usar para implementar um data warehouse. Para maior clareza, neste artigo este último é mencionado como Armazém de Tecidos.

Gorjeta

Se você é inexperiente com modelagem dimensional, considere que esta série de artigos é o seu primeiro passo. Não se destina a fornecer uma discussão completa sobre o design de modelagem dimensional. Para obter mais informações, consulte diretamente o conteúdo publicado amplamente adotado, como The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3ª edição, 2013), de Ralph Kimball, e outros.

Design do esquema de estrela

O esquema em estrela é uma técnica de projeto de modelagem dimensional adotada por data warehouses relacionais. É uma abordagem de design recomendada a ser adotada ao criar um Fabric Warehouse. Um esquema em estrela compreende tabelas de fatos e tabelas de dimensões.

  • As tabelas de dimensão descrevem as entidades relevantes para a sua organização e os requisitos de análise. Em linhas gerais, eles representam as coisas que você modela. As coisas podem ser produtos, pessoas, lugares ou qualquer outro conceito, incluindo data e hora. Para obter mais informações e práticas recomendadas de design, consulte Tabelas de dimensão nesta série.
  • As tabelas de fatos armazenam medições associadas a observações ou eventos. Eles podem armazenar ordens de venda, saldos de estoque, taxas de câmbio, leituras de temperatura e muito mais. As tabelas de fatos contêm chaves de dimensão juntamente com valores granulares que podem ser agregados. Para obter mais informações e práticas recomendadas de design, consulte Tabelas de fatos nesta série.

Um design de esquema em estrela é otimizado para cargas de trabalho de consulta analítica. Por esse motivo, é considerado um pré-requisito para modelos semânticos corporativos do Power BI. As consultas analíticas estão preocupadas com filtrar, agrupar, classificar e resumir dados. Os dados de fatos são resumidos dentro do contexto de filtros e agrupamentos das tabelas de dimensões relacionadas.

A razão pela qual é chamado de esquema de estrela é porque uma tabela de fatos forma o centro de uma estrela, enquanto as tabelas de dimensões relacionadas formam os pontos da estrela.

O diagrama mostra uma ilustração de um esquema em estrela para fatos de vendas. Existem cinco dimensões, cada uma localizada em um ponto da estrela.

Um esquema de estrelas geralmente contém várias tabelas de fatos e, portanto, várias estrelas.

Um esquema em estrela bem projetado oferece consultas de alto desempenho (relacionais) devido ao menor número de junções de tabelas e à maior probabilidade de índices úteis. Além disso, um esquema em estrela geralmente requer baixa manutenção à medida que o projeto do data warehouse evolui. Por exemplo, adicionar uma nova coluna a uma tabela de dimensões para dar suporte à análise por um novo atributo é uma tarefa relativamente simples de executar. Como é adicionar novos fatos e dimensões à medida que o escopo do data warehouse evolui.

Periodicamente, talvez diariamente, as tabelas em um modelo dimensional são atualizadas e carregadas por um processo de Extração, Transformação e Carga (ETL). Este processo sincroniza os seus dados com os sistemas de origem, que armazenam dados operacionais. Para obter mais informações, consulte Carregar tabelas nesta série.

Modelagem dimensional para Power BI

Para soluções empresariais, um modelo dimensional em um Armazém de Malha é um pré-requisito recomendado para criar um modelo semântico do Power BI. O modelo dimensional não apenas suporta o modelo semântico, mas também é uma fonte de dados para outras experiências, como modelos de aprendizado de máquina.

No entanto, em circunstâncias específicas, pode não ser a melhor abordagem. Por exemplo, analistas de autoatendimento que precisam de liberdade e agilidade para agir rapidamente e sem dependência de TI podem criar modelos semânticos que se conectam diretamente aos dados de origem. Nesses casos, a teoria da modelagem dimensional ainda é relevante. Essa teoria ajuda os analistas a criar modelos intuitivos e eficientes, evitando a necessidade de criar e carregar um modelo dimensional em um data warehouse. Em vez disso, um modelo quase dimensional pode ser criado usando o Power Query, que define a lógica para se conectar e transformar dados de origem para criar e carregar as tabelas de modelo semântico. Para obter mais informações, consulte Compreender o esquema em estrela e a importância para o Power BI.

Importante

Quando utiliza o Power Query para definir um modelo dimensional no modelo semântico, não consegue gerir alterações históricas, o que poderá ser necessário para analisar o passado com precisão. Se isso for um requisito, você deve criar um data warehouse e permitir que processos ETL periódicos capturem e armazenem adequadamente as alterações de dimensão.

Planejando um data warehouse

Você deve abordar a criação de um data warehouse e o design de um modelo de dimensão como um empreendimento sério e importante. Isso porque o data warehouse é um componente central da sua plataforma de dados. Ele deve formar uma base sólida que ofereça suporte a análises e relatórios — e, portanto, à tomada de decisões — para toda a sua organização.

Para isso, seu data warehouse deve se esforçar para armazenar dados de qualidade, conformes e historicamente precisos como uma única versão da verdade. Ele deve fornecer dados compreensíveis e navegáveis com desempenho rápido e impor permissões para que os dados certos só possam ser acessados pelas pessoas certas. Esforce-se para projetar seu data warehouse para resiliência, permitindo que ele se adapte às mudanças à medida que suas necessidades evoluem.

A implementação bem-sucedida de um data warehouse depende de um bom planejamento. Para obter informações sobre considerações estratégicas e táticas e itens de ação que levam à adoção bem-sucedida do Fabric e do seu data warehouse, consulte o roteiro de adoção do Microsoft Fabric.

Gorjeta

Recomendamos que você crie seu data warehouse corporativo iterativamente. Comece primeiro com as áreas temáticas mais importantes e, ao longo do tempo, de acordo com a prioridade e os recursos, estenda o armazém de dados a outras áreas temáticas.

No próximo artigo desta série, saiba mais sobre orientação e práticas recomendadas de design para tabelas de dimensão.