Modelagem dimensional no Warehouse do Microsoft Fabric
Aplica-se a:✅ ponto de extremidade de análise do SQL e Warehouse no Microsoft Fabric
Este artigo é o primeiro de uma série sobre modelagem dimensional em um warehouse. Ele apresenta diretrizes práticas para o Warehouse no Microsoft Fabric, uma experiência que oferece suporte a muitos recursos de T-SQL, como a criação de tabelas e o gerenciamento de dados em tabelas. Assim, você tem total controle ao criar suas tabelas de modelos dimensionais e carregá-las com dados.
Observação
Neste artigo, o termo data warehouse refere-se a um data warehouse empresarial, que oferece integração abrangente de dados críticos em toda a organização. Por outro lado, o termo autônomo warehouse refere-se a um Warehouse do Fabric, uma oferta de banco de dados relacional de software como serviço (SaaS) que pode ser usada para implementar um data warehouse. Para maior clareza, neste artigo, este último termo é mencionado como Fabric Warehouse.
Dica
Caso não tenha experiência com modelagem dimensional, esta série de artigos é o primeiro passo. Ela não se destina a fornecer uma discussão completa sobre o projeto de modelagem dimensional. Para obter mais informações, consulte diretamente o conteúdo publicado amplamente adotado, como The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3ª edição, 2013) de Ralph Kimball e outros.
Design do esquema em estrela
O Esquema em estrela é uma técnica de design para modelagem dimensional, adotada por data warehouses relacionais. É uma abordagem de design recomendada ao criar um Warehouse do Fabric. Um esquema em estrela compreende tabelas de fatos e tabelas de dimensões.
- As tabelas de dimensões descrevem as entidades relevantes para sua organização e os requisitos de análise. Em linhas gerais, elas representam as coisas que você modela. As coisas podem ser produtos, pessoas, lugares ou qualquer outro conceito, incluindo data e hora. Para obter mais informações e melhores práticas de design, confira Tabelas de dimensões nesta série.
- As tabelas de fatos armazenam medidas associadas a observações ou eventos. Elas podem armazenar ordens de venda, saldos de estoque, taxas de câmbio, leituras de temperatura e muito mais. As tabelas de fatos contêm chaves de dimensão com valores granulares que podem ser agregados. Para obter mais informações e melhores práticas de design, confira Tabelas de fatos nesta série.
Um design de esquema em estrela é otimizado para cargas de trabalho de consulta analítica. Por esse motivo, ele é considerado um pré-requisito para modelos semânticos empresariais do Power BI. As consultas analíticas se preocupam em filtrar, agrupar, classificar e resumir dados. Os dados de fatos são resumidos no contexto de filtros e agrupamentos das tabelas de dimensões relacionadas.
O motivo de ser chamado esquema em estrela é porque uma tabela de fatos forma o centro de uma estrela, enquanto as tabelas de dimensões relacionadas formam as pontas dela.
Um esquema em estrela geralmente contém várias tabelas de fatos e, portanto, várias estrelas.
Um esquema em estrela bem projetado fornece consultas (relacionais) de alto desempenho devido a menos ingressos de tabela e à maior probabilidade de índices úteis. Além disso, um esquema em estrela geralmente requer baixa manutenção à medida que o design do data warehouse evolui. Por exemplo, adicionar uma coluna a uma tabela de dimensões para dar suporte à análise por um novo atributo é uma tarefa relativamente simples de executar. Uma vez que está adicionando novos fatos e dimensões à medida que o escopo do data warehouse evolui.
Periodicamente, talvez diariamente, as tabelas em um modelo dimensional são atualizadas e carregadas por um processo de extração, transformação e carregamento (ETL). Esse processo sincroniza os dados com os sistemas de origem, que armazenam dados operacionais. Para obter mais informações, confira Carregar tabelas nesta série.
Modelagem dimensional para o Power BI
Para soluções empresariais, um modelo dimensional em um Warehouse do Fabric é um pré-requisito recomendado para criar um modelo semântico do Power BI. O modelo dimensional não apenas é compatível com o modelo semântico, mas também é uma fonte de dados para outras experiências, como modelos de machine learning.
No entanto, em circunstâncias específicas, pode não ser a melhor abordagem. Por exemplo, analistas de autoatendimento que precisam de liberdade e agilidade para agir rapidamente e sem dependência de TI podem criar modelos semânticos que se conectam diretamente aos dados de origem. Nesses casos, a teoria da modelagem dimensional ainda é relevante. Essa teoria ajuda os analistas a desenvolver modelos intuitivos e eficientes, evitando a necessidade de criar e carregar um modelo dimensional em um data warehouse. Em vez disso, um modelo quase dimensional pode ser criado usando o Power Query, que define a lógica para se conectar e transformar dados de origem a fim de criar e carregar as tabelas do modelo semântico. Para obter mais informações, confira Entender o esquema em estrela e a importância dele para o Power BI.
Importante
Ao utilizar o Power Query para definir um modelo dimensional no modelo semântico, não é possível gerenciar alterações históricas, o que pode ser necessário para analisar o passado com precisão. Se esse for um requisito, você deve criar um data warehouse e permitir que processos periódicos de ETL capturem e armazenem adequadamente as alterações de dimensão.
Planejamento de um data warehouse
Você deve abordar a criação de um data warehouse e o design de um modelo de dimensão como uma tarefa séria e importante. Isso ocorre porque o data warehouse é um componente central da sua plataforma de dados. Ele deve formar uma base sólida que ofereça suporte a análises e relatórios e, portanto, à tomada de decisões para toda a organização.
Para esse fim, seu data warehouse deve armazenar dados de qualidade, conformes e historicamente precisos como uma versão única da verdade. Ele deve entregar dados compreensíveis e navegáveis com desempenho rápido e impor permissões para que os dados certos só possam ser acessados pelas pessoas certas. Dê o seu melhor para projetar um data warehouse com resiliência, permitindo que se adapte às alterações à medida que suas necessidades evoluem.
A implementação bem-sucedida de um data warehouse depende de um bom planejamento. Para obter informações sobre considerações estratégicas e táticas, além de itens de ação, que levam à adoção bem-sucedida do Fabric e do data warehouse, confira o roteiro de adoção do Microsoft Fabric.
Dica
Recomendamos criar seu data warehouse empresarial iterativamente. Comece com as áreas temáticas mais importantes e, ao longo do tempo, de acordo com a prioridade e os recursos, amplie o data warehouse com outras.
Conteúdo relacionado
No próximo artigo desta série, saiba mais sobre as diretrizes e melhores práticas de design para tabelas de dimensões.