Tabelle nel data warehousing in Microsoft Fabric.
Si applica a✅: Warehouse in Microsoft Fabric
Questo articolo illustra in dettaglio i concetti chiave per la progettazione di tabelle in Microsoft Fabric.
Nelle tabelle, i dati sono organizzati in modo logico in formato a righe e colonne. Ogni riga rappresenta un record univoco e ogni colonna rappresenta un campo all'interno del record.
- In Warehouse le tabelle sono oggetti di database che contengono tutti i dati transazionali.
Determinare la categoria della tabella
Uno schema star organizza i dati in tabelle fact e tabelle delle dimensioni. Alcune tabelle vengono usate per i dati di integrazione o di staging prima di spostarli in una tabella dei fatti o delle dimensioni. Quando si progetta una tabella, occorre decidere se i dati appartengono a una tabella fact, delle dimensioni o di integrazione. Questa decisione determina la struttura della tabella.
Le tabelle fact contengono i dati quantitativi che vengono comunemente generati in un sistema transazionale e successivamente caricati nel data warehouse. Un'azienda di vendita al dettaglio, ad esempio, genera quotidianamente transazioni di vendita e successivamente carica i dati in una tabella fact di data warehouse per analizzarli.
Le tabelle delle dimensioni contengono i dati degli attributi che possono cambiare, ma che in genere cambiano raramente. Il nome e l'indirizzo di un cliente, ad esempio, vengono archiviati in una tabella delle dimensioni e aggiornati solo quando viene modificato il profilo del cliente. Per ridurre al minimo le dimensioni di una tabella dei fatti di grandi dimensioni, si può evitare di inserire il nome e l'indirizzo del cliente in ogni riga della tabella. La tabella fact e la tabella delle dimensioni possono invece condividere un ID cliente. Una query può creare un join tra le due tabelle per associare il profilo e le transazioni di un cliente.
Le tabelle di integrazione sono un luogo in cui integrare o gestire temporaneamente i dati. È ad esempio possibile caricare i dati in una tabella di staging, eseguire trasformazioni sui dati in gestione temporanea e quindi inserirli in una tabella di produzione.
Una tabella archivia i dati in OneLake come parte del warehouse. La tabella e i dati sono persistenti indipendentemente dalla presenza o meno di una sessione aperta.
Tabelle nel Warehouse
Per visualizzare l'organizzazione delle tabelle, è possibile usare fact
, dim
o int
come prefissi dei nomi delle tabelle. La tabella seguente mostra alcuni dei nomi di tabella e dello schema per il data warehouse di esempio WideWorldImportersDW.
Nome tabella sorgente WideWorldImportersDW | Tipo di tabella | Nome tabella data warehouse: |
---|---|---|
Città | Dimensione | wwi.DimCity |
Ordinamento | Fatto | wwi.FactOrder |
- I nomi delle tabelle usano la distinzione tra maiuscole e minuscole.
- I nomi delle tabelle non possono contenere
/
o\
o terminare con un.
.
Crea una tabella
È possibile creare una tabella come nuova tabella vuota. È inoltre possibile creare e popolare una tabella con i risultati di un'istruzione SELECT. Di seguito sono riportati i comandi T-SQL per la creazione di una tabella.
Istruzione T-SQL | Descrizione |
---|---|
CREATE TABLE | Crea una tabella vuota definendo tutte le opzioni e le colonne della tabella. |
CREATE TABLE AS SELECT | Popola una nuova tabella con i risultati di un'istruzione SELECT. Le colonne e i tipi di dati della tabella si basano sui risultati dell'istruzione SELECT. Per importare i dati, questa istruzione può selezionare da una tabella esterna. |
Questo esempio crea una tabella con due colonne:
CREATE TABLE MyTable (col1 int, col2 int );
Nomi schema
Warehouse supporta la creazione di schemi personalizzati. Come in SQL Server gli schemi sono un modo valido per raggruppare le tabelle usate in modo simile. Il codice seguente crea uno schema definito dall'utente denominato wwi
.
- I nomi di schemi fanno distinzione tra maiuscole e minuscole.
- I nomi di schemi non possono contenere
/
o\
o terminare con un.
.
CREATE SCHEMA wwi;
Tipo di dati
Microsoft Fabric supporta i tipi di dati T-SQL usati più di frequente.
- Per altre informazioni sui tipi di dati, vedere Tipi di dati in Microsoft Fabric.
- Quando si crea una tabella in Warehouse, esaminare il riferimento ai tipi di dati in CREATE TABLE (Transact-SQL).
- Per una guida alla creazione di una tabella in Warehouse, vedere Creare tabelle.
Regole di confronto
Attualmente, Latin1_General_100_BIN2_UTF8
è collage predefinito e l'unico supportato sia per le tabelle che per i metadati.
Statistiche
Quando crea il piano per l'esecuzione di una query, Query Optimizer usa le statistiche a livello di colonna. Per migliorare le prestazioni delle query, è importante avere statistiche su singole colonne, in particolare sulle colonne usate nei join delle query. Warehouse supporta la creazione automatica di statistiche.
L'aggiornamento delle statistiche non è automatico. Aggiornare le statistiche dopo l'aggiunta o la modifica di un numero significativo di righe. Aggiornare, ad esempio, le statistiche dopo un caricamento. Per ulteriori informazioni, vedi Statistiche.
Chiave primaria, chiave esterna e chiave univoca
Per Warehouse, i vincoli PRIMARY KEY e UNIQUE sono supportati solo quando vengono usati entrambi NONCLUSTERED e NOT ENFORCED.
FOREIGN KEY è supportato solo quando viene usato NOT ENFORCED.
- Per la sintassi, selezionare ALTER TABLE.
- Per altre informazioni, vedere Chiavi primarie, chiavi esterne e chiavi univoche in Warehouse in Microsoft Fabric.
Allineare i dati di origine con il data warehouse
Le tabelle di Warehouse vengono popolate caricando i dati da un'altra origine dati. Per eseguire un caricamento corretto, il numero e i tipi di dati delle colonne nei dati di origine devono essere allineati con la definizione della tabella nel data warehouse.
Se i dati provengono da più archivi dati, è possibile trasferirli nel data warehouse e archiviarli in una tabella di integrazione. Dopo che i dati sono stati inseriti nella tabella di integrazione, è possibile sfruttare la potenza di Data Warehouse per eseguire operazioni di trasformazione. Dopo aver preparati i dati, è possibile inserirli nelle tabelle di produzione.
Limiti
Warehouse supporta molte delle funzionalità per tabelle offerte da altri database, ma non tutte.
Di seguito sono elencate alcune delle funzionalità per tabelle che non sono attualmente supportate.
- Massimo 1024 colonne per tabella
- Colonne calcolate
- Viste indicizzate
- Tabelle partizionate
- Sequenza
- Colonne di tipo sparse
- Chiavi surrogate nelle sequenze numeriche con colonne Identity
- Sinonimi
- Tabelle temporanee
- Trigger
- Indici univoci
- Tipi definiti dall'utente
Importante
Esistono limitazioni per l'aggiunta di vincoli di tabella o colonne quando si usa il controllo del codice sorgente con Warehouse.