Tables dans l’entrepôt de données dans Microsoft Fabric

S’applique à :✅ entrepôt dans Microsoft Fabric

Cet article détaille les concepts clés pour la conception de tables dans Microsoft Fabric.

Dans les tables, les données sont logiquement organisées en lignes et en colonnes. Chaque ligne représente un enregistrement unique et chaque colonne représente un champ dans l'enregistrement.

  • Dans l’entrepôt, les tables sont des objets de base de données qui contiennent toutes les données transactionnelles.

Déterminer la catégorie des tables

Un schéma en étoile organise les données dans des tables de faits et les tables de dimension. Certaines tables sont utilisées pour l’intégration ou la mise en lots des données avant leur transfert dans une table de faits ou de dimension. Quand vous concevez une table, déterminez si les données de la table sont contenues dans une table de faits, de dimension ou d’intégration. Ceci est important pour choisir une structure appropriées pour la table.

  • Les tables de faits contiennent des données quantitatives qui sont le plus souvent générées dans un système transactionnel avant d’être chargées dans l’entrepôt de données. Par exemple, une entreprise de vente au détail génère des transactions de ventes chaque jour et charge ensuite ces données dans une table de faits de l’entrepôt de données pour les analyser.

  • Les tables de dimension contiennent des données d’attribut modifiables, mais qui changent peu en règle générale. Par exemple, le nom et l’adresse d’un client sont stockés dans une table de dimension et sont mis à jour uniquement si le profil du client change. Pour réduire la taille d’une table de faits volumineuse, il est inutile d’indiquer le nom et l’adresse du client dans chaque ligne d’une table de faits. Au lieu de cela, la table de faits et la table de dimension peuvent partager un ID client. Vous pouvez alors créer une requête de jointure entre les deux tables pour associer le profil d’un client et les transactions qui le concernent.

  • Les tables d’intégration fournissent un emplacement pour l’intégration ou la mise en lots des données. Vous pouvez, par exemple, charger des données dans une table de mise en lots, effectuer des transformations sur ces données, puis insérer les données dans une table de production.

Une table stocke les données dans OneLake dans le cadre de l'entrepôt. La table et les données sont persistantes, qu’une session soit ouverte ou non.

Tables dans l'entrepôt

Pour voir l’organisation des tables, vous pouvez utiliser les préfixes fact, dim et int dans les noms de table. La table suivante répertorie quelques noms de schéma et de table pour l’entrepôt de données exemple WideWorldImportersDW.

WideWorldImportersDW Nom de la table source Type de la table Data Warehouse Nom de la table
Ville Dimension wwi.DimCity
Commande Fact wwi.FactOrder
  • Les noms de table sont sensibles à la casse.
  • Les noms de tables ne peuvent pas contenir / ou \, ou se terminer par un ..

Créer une table

Pour l’entrepôt, vous pouvez créer une table à partir d’une nouvelle table vide. Vous pouvez aussi créer une table et la remplir avec les résultats d’une instruction select. Le tableau suivant répertorie les instructions T-SQL disponibles pour la création d’une table.

Instruction T-SQL Description
CREATE TABLE Crée une table vide en définissant toutes les colonnes et options de la table.
CREATE TABLE AS SELECT Crée une table et la remplit avec les résultats d’une instruction select. Les colonnes et les types de données de la table sont basés sur les résultats de l’instruction select. Pour importer des données, cette instruction peut sélectionner les données dans une table externe.

Cet exemple crée une table contenant deux colonnes :

CREATE TABLE MyTable (col1 int, col2 int );  

Noms de schémas

L’entrepôt prend en charge la création de schémas personnalisés. Comme dans SQL Server, les schémas sont un bon moyen de regrouper des objets utilisés de manière similaire. Le code suivant crée un schéma défini par l’utilisateur nommé wwi.

  • Les noms de schéma sont sensibles à la casse.
  • Les noms de schémas ne peuvent pas contenir / ou \, ou se terminer par un ..
CREATE SCHEMA wwi;

Types de données

Microsoft Fabric prend en charge les types de données T-SQL les plus couramment utilisés.

Classement

Actuellement, Latin1_General_100_BIN2_UTF8 est le classement par défaut et uniquement pris en charge pour les tables et les métadonnées.

Statistiques

L’optimiseur de requête utilise des statistiques au niveau des colonnes quand il crée le plan d’exécution d’une requête. Pour améliorer les performances des requêtes, il est important d’avoir des statistiques sur des colonnes individuelles, en particulier les colonnes utilisées dans les jointures de requête. L’entrepôt prend en charge la création automatique de statistiques.

La mise à jour statistique ne se fait pas automatiquement. Mettez à jour les statistiques après l’ajout ou la modification d’un nombre significatif de lignes. Par exemple, effectuez une mise à jour des statistiques après un chargement. Pour plus d’informations, voir Statistiques.

Clé primaire, clé étrangère et clé unique

Pour l’entrepôt, les contraintes PRIMARY KEY et UNIQUE ne sont prises en charge que lorsque NONCLUSTERED et NOT ENFORCED sont tous deux utilisés.

FOREIGN KEY n'est pris en charge que lorsque NOT ENFORCED est utilisé.

Aligner les données sources avec l’entrepôt de données

Les tables de l’entrepôt sont remplies avec les données chargées à partir d’une autre source de données. Pour accomplir un chargement correct, le nombre et les types de données des colonnes dans les données sources doivent être alignés sur la définition de la table dans l’entrepôt de données.

Si les données proviennent de plusieurs magasins, vous pouvez les porter dans l’entrepôt de données et les stocker dans une table d’intégration. Vous pouvez ensuite effectuer des opérations de transformation sur les données de la table d’intégration en tirant parti de la puissance de l’entrepôt de données. Une fois que les données sont préparées, vous pouvez les insérer dans des tables de production.

Limites

L’entrepôt prend en charge beaucoup des fonctionnalités de table proposées par d’autres bases de données, mais pas toutes.

La liste suivante répertorie certaines fonctionnalités de table qui ne sont actuellement pas prises en charge.

  • Nombre maximal de 1 024 colonnes par table
  • Colonnes calculées
  • Vues indexées
  • tables partitionnées ;
  • Séquence
  • Colonnes éparses
  • Clés de substitution sur les séquences de nombres avec des colonnes d’identité
  • Synonymes
  • tables temporaires ;
  • Déclencheurs
  • Index uniques
  • Types définis par l'utilisateur

Important

Il existe des limitations à l’ajout de contraintes de table ou de colonnes lors de l’utilisation du contrôle de code source avec Warehouse.