Tabeller i datalager i Microsoft Fabric

Gäller för:✅ Warehouse i Microsoft Fabric

Den här artikeln beskriver viktiga begrepp för att utforma tabeller i Microsoft Fabric.

I tabeller ordnas data logiskt i ett rad- och kolumnformat. Varje rad representerar en unik post och varje kolumn representerar ett fält i posten.

  • I Warehouse är tabeller databasobjekt som innehåller alla transaktionsdata.

Fastställa tabellkategori

Ett star-schema organiserar data i faktatabeller och dimensionstabeller. Vissa tabeller används för integrering eller mellanlagring av data innan de flyttas till en fakta- eller dimensionstabell. När du utformar en tabell bestämmer du om tabelldata ska tillhöra en fakta-, dimensions- eller integrationstabell. Detta beslut informerar lämplig tabellstruktur.

  • Faktatabeller innehåller kvantitativa data som vanligtvis genereras i ett transaktionssystem och sedan läses in i informationslagret. Ett detaljhandelsföretag genererar till exempel försäljningstransaktioner varje dag och läser sedan in data i en faktatabell för informationslager för analys.

  • Dimensionstabeller innehåller attributdata som kan ändras men vanligtvis ändras sällan. Till exempel lagras en kunds namn och adress i en dimensionstabell och uppdateras endast när kundens profil ändras. För att minimera storleken på en stor faktatabell behöver kundens namn och adress inte finnas i varje rad i en faktatabell. I stället kan faktatabellen och dimensionstabellen dela ett kund-ID. En fråga kan koppla de två tabellerna för att associera en kunds profil och transaktioner.

  • Integreringstabeller är en plats för integrering eller mellanlagring av data. Du kan till exempel läsa in data till en mellanlagringstabell, utföra transformeringar på data i mellanlagringen och sedan infoga data i en produktionstabell.

En tabell lagrar data i OneLake som en del av lagret. Tabellen och data bevaras oavsett om en session är öppen eller inte.

Tabeller i informationslagret

Om du vill visa tabellernas organisation kan du använda fact, dimeller int som prefix för tabellnamnen. I följande tabell visas några av schema- och tabellnamnen för WideWorldImportersDW-exempelinformationslagret .

WideWorldImportersDW Källtabellnamn Tabelltyp Namn på informationslagertabell
City Dimension wwi.DimCity
Order Fakta wwi.FactOrder
  • Tabellnamn är skiftlägeskänsliga.
  • Tabellnamn får inte innehålla / eller \ sluta med en ..

Skapa en tabell

För Warehouse kan du skapa en tabell som en ny tom tabell. Du kan också skapa och fylla i en tabell med resultatet av en select-instruktion. Följande är T-SQL-kommandona för att skapa en tabell.

T-SQL-instruktion beskrivning
CREATE TABLE Skapar en tom tabell genom att definiera alla tabellkolumner och alternativ.
CREATE TABLE AS SELECT Fyller i en ny tabell med resultatet av en select-instruktion. Tabellkolumnerna och datatyperna baseras på select-instruktionsresultaten. Om du vill importera data kan den här instruktionen välja från en extern tabell.

I det här exemplet skapas en tabell med två kolumner:

CREATE TABLE MyTable (col1 int, col2 int );  

Schemanamn

Warehouse har stöd för att skapa anpassade scheman. Precis som i SQL Server är scheman ett bra sätt att gruppera objekt som används på liknande sätt. Följande kod skapar ett användardefinierat schema med namnet wwi.

  • Schemanamn är skiftlägeskänsliga.
  • Schemanamn får inte innehålla / eller \ sluta med en ..
CREATE SCHEMA wwi;

Datatyper

Microsoft Fabric stöder de vanligaste T-SQL-datatyperna.

Sortering

Latin1_General_100_BIN2_UTF8 För närvarande är standardsortering och stöds endast för både tabeller och metadata.

Statistik

Frågeoptimeraren använder statistik på kolumnnivå när den skapar planen för att köra en fråga. För att förbättra frågeprestandan är det viktigt att ha statistik om enskilda kolumner, särskilt kolumner som används i frågekopplingar. Warehouse har stöd för automatisk skapande av statistik.

Statistisk uppdatering sker inte automatiskt. Uppdatera statistik efter att ett stort antal rader har lagts till eller ändrats. Uppdatera till exempel statistik efter en inläsning. Mer information finns i Statistik.

Primärnyckel, sekundärnyckel och unik nyckel

För begränsningarna Lager, PRIMÄRNYCKEL och UNIK stöds endast när både NONCLUSTERED och NOT ENFORCED används.

SEKUNDÄRNYCKEL stöds endast när NOT ENFORCED används.

Justera källdata med informationslagret

Informationslagertabeller fylls i genom att data läses in från en annan datakälla. För att uppnå en lyckad belastning måste antalet och datatyperna för kolumnerna i källdata överensstämma med tabelldefinitionen i informationslagret.

Om data kommer från flera datalager kan du portera data till informationslagret och lagra dem i en integrationstabell. När data finns i integrationstabellen kan du använda kraften i informationslagret för att implementera transformeringsåtgärder. När data har förberetts kan du infoga dem i produktionstabeller.

Begränsningar

Warehouse har stöd för många, men inte alla, tabellfunktioner som erbjuds av andra databaser.

I följande lista visas några av tabellfunktionerna som för närvarande inte stöds.

  • Maximalt 1 024 kolumner per tabell
  • Beräknade kolumner
  • Indexerade vyer
  • Partitionerade tabeller
  • Sequence
  • Glesa kolumner
  • Surrogatnycklar för nummersekvenser med identitetskolumner
  • Synonymer
  • Temporära tabeller
  • Utlösare
  • Unika index
  • Användardefinierade typer

Viktigt!

Det finns begränsningar med att lägga till tabellbegränsningar eller kolumner när du använder Källkontroll med Warehouse.