Modellazione dimensionale in Microsoft Fabric Warehouse

Si applica a:✅ Endpoint sql analitica e Warehouse in Microsoft Fabric

Questo articolo è il primo di una serie sulla modellazione dimensionale all'interno di un magazzino. Fornisce indicazioni pratiche per Warehouse in Microsoft Fabric, un'esperienza che supporta molte funzionalità T-SQL, ad esempio la creazione di tabelle e la gestione dei dati nelle tabelle. È quindi possibile controllare completamente la creazione delle tabelle del modello dimensionale e il caricamento con i dati.

Nota

In questo articolo il termine data warehouse si riferisce a un data warehouse aziendale, che offre un'integrazione completa dei dati critici nell'organizzazione. Al contrario, il data warehouse autonomo si riferisce a un warehouse di infrastruttura, ovvero un database relazionale SaaS (Software as a Service) che è possibile usare per implementare un data warehouse. Per maggiore chiarezza, in questo articolo quest'ultimo è menzionato come Fabric Warehouse.

Suggerimento

Se si è inesperti con la modellazione dimensionale, considerare che questa serie di articoli è il primo passaggio. Non è progettato per fornire una discussione completa sulla progettazione di modellazione dimensionale. Per altre informazioni, fare riferimento direttamente a contenuti pubblicati ampiamente adottati, ad esempio The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (3rd edition, 2013) di Ralph Kimball e altri.

Progettazione dello schema star

Lo schema Star è una tecnica di progettazione di modellazione dimensionale adottata dai data warehouse relazionali. È consigliabile adottare un approccio di progettazione quando si crea un warehouse di infrastruttura. Uno schema star comprende tabelle dei fatti e tabelle delle dimensioni.

  • Le tabelle delle dimensioni descrivono le entità rilevanti per l'organizzazione e i requisiti di analitica. In generale, rappresentano gli elementi modellati. Le cose possono essere prodotti, persone, luoghi o qualsiasi altro concetto, tra cui data e ora. Per altre informazioni e procedure consigliate per la progettazione, vedere Tabelle delle dimensioni in questa serie.
  • Le tabelle dei fatti archiviano le misurazioni associate a osservazioni o eventi. Possono archiviare ordini di vendita, saldi azionari, tassi di cambio, letture della temperatura e altro ancora. Le tabelle dei fatti contengono chiavi di dimensione insieme a valori granulari che possono essere aggregati. Per altre informazioni e procedure consigliate per la progettazione, vedere Tabelle dei fatti in questa serie.

Una progettazione dello schema star è ottimizzata per i carichi di lavoro di query analitiche. Per questo motivo, è considerato un prerequisito per i modelli semantici di Power BI aziendali. Le query analitiche riguardano il filtro, il raggruppamento, l'ordinamento e il riepilogo dei dati. I dati dei fatti vengono riepilogati nel contesto dei filtri e dei raggruppamenti delle tabelle delle dimensioni correlate.

Il motivo per cui viene chiamato schema star è dovuto al fatto che una tabella dei fatti costituisce il centro di una stella mentre le tabelle delle dimensioni correlate formano i punti della stella.

Il diagramma mostra un'illustrazione di uno schema star per i fatti di vendita. Ci sono cinque dimensioni, ognuna posizionata a un punto della stella.

Uno schema star spesso contiene più tabelle dei fatti e quindi più stelle.

Uno schema star ben progettato offre query a prestazioni elevate (relazionali) a causa di un minor numero di join di tabelle e maggiore probabilità di indici utili. Inoltre, uno schema star richiede spesso una manutenzione ridotta man mano che la progettazione del data warehouse si evolve. Ad esempio, l'aggiunta di una nuova colonna a una tabella delle dimensioni per supportare l'analisi da un nuovo attributo è un'attività relativamente semplice da eseguire. Man mano che si aggiungono nuovi fatti e dimensioni, l'ambito del data warehouse si evolve.

Periodicamente, forse ogni giorno, le tabelle in un modello dimensionale vengono aggiornate e caricate da un processo ETL (Extract, Transform e Load). Questo processo sincronizza i dati con i sistemi di origine, che archivia i dati operativi. Per altre informazioni, vedere Caricare tabelle in questa serie.

Modellazione dimensionale per Power BI

Per le soluzioni aziendali, un modello dimensionale in un'istanza di Fabric Warehouse è un prerequisito consigliato per la creazione di un modello semantico di Power BI. Non solo il modello dimensionale supporta il modello semantico, ma è anche un'origine di dati per altre esperienze, ad esempio i modelli di Machine Learning.

Tuttavia, in circostanze specifiche potrebbe non essere l'approccio migliore. Ad esempio, gli analisti self-service che necessitano di libertà e agilità per agire rapidamente e senza dipendenze dall'IT, potrebbero creare modelli semantici che si connettono direttamente ai dati di origine. In questi casi, la teoria della modellazione dimensionale è ancora rilevante. Questa teoria aiuta gli analisti a creare modelli intuitivi ed efficienti, evitando la necessità di creare e caricare un modello dimensionale in un data warehouse. È invece possibile creare un modello quasi dimensionale usando Power Query, che definisce la logica a cui connettersi e trasformare i dati di origine per creare e caricare le tabelle del modello semantico. Per altre informazioni, vedere Informazioni su uno schema star e sull'importanza di questo schema per Power BI.

Importante

Quando si usa Power Query per definire un modello dimensionale nel modello semantico, non è possibile gestire la modifica cronologica, che potrebbe essere necessario analizzare accuratamente il passato. Se si tratta di un requisito, è necessario creare un data warehouse e consentire ai processi ETL periodici di acquisire e archiviare in modo appropriato le modifiche delle dimensioni.

Pianificazione di un data warehouse

È consigliabile affrontare la creazione di un data warehouse e la progettazione di un modello di dimensione come un'impresa seria e importante. Questo perché il data warehouse è un componente principale della piattaforma dati. Deve costituire una solida base che supporti analitica e creazione di report, e quindi il processo decisionale, per l'intera organizzazione.

A questo scopo, il data warehouse deve cercare di archiviare dati qualitativi, conformi e storicamente accurati come singola versione della verità. Deve fornire dati comprensibili e navigabili con prestazioni veloci e applicare autorizzazioni in modo che i dati corretti possano essere accessibili solo dalle persone giuste. Cercare di progettare il data warehouse per la resilienza, consentendogli di adattarsi al cambiamento man mano che i requisiti si evolvono.

L'implementazione corretta di un data warehouse dipende da una buona pianificazione. Per informazioni sulle considerazioni strategiche e tattiche e sugli elementi di azione che portano all'adozione corretta di Fabric e del data warehouse, vedere la roadmap per l'adozione di Microsoft Fabric.

Suggerimento

È consigliabile creare il data warehouse aziendale in modo iterativo. Iniziare prima con le aree di interesse più importanti e quindi nel corso del tempo, in base alla priorità e alle risorse, estendere il data warehouse con altre aree di interesse.

Nell'articolo successivo di questa serie vengono fornite informazioni sulle linee guida e sulle procedure consigliate per la progettazione per le tabelle delle dimensioni.