Qu’est-ce qu’un lakehouse dans Microsoft Fabric ?

Microsoft Fabric Lakehouse est une plateforme d'architecture de données permettant de stocker, gérer et analyser des données structurées et non structurées en un seul emplacement. Cette solution flexible et évolutive permet aux organisations de gérer de grands volumes de données à l’aide de divers outils et infrastructures pour traiter, puis analyser ces données. Elle s’intègre à d’autres outils de gestion et d’analyse des données pour fournir une solution complète pour l’engineering données et l’analyse des données.

Gif of overall lakehouse experience.

Point de terminaison d’analytique SQL Lakehouse

Le lakehouse crée une couche de service en générant automatiquement un point de terminaison d’analytique SQL et un modèle sémantique par défaut lors de la création. Cette nouvelle fonctionnalité semi-transparente permet à l’utilisateur de travailler directement sur les tables Delta dans le lac pour fournir une expérience fluide et performante, de l’ingestion des données à la création de rapports.

Il est important de noter que le point de terminaison d’analytique SQL est une expérience en lecture seule qui ne prend pas en charge la surface d’exposition T-SQL complète d’un entrepôt de données transactionnelles.

Remarque

Seules les tables au format Delta sont disponibles dans le point de terminaison d’analytique SQL. Vous ne pouvez pas interroger les formats Parquet, CSV et autres à l’aide du point de terminaison d’analytique SQL. Si vous ne voyez pas votre table, vous devez la convertir au format Delta.

Détection et inscription automatiques des tables

La détection et l’inscription automatiques des tables sont une fonctionnalité de Lakehouse qui fournit une expérience de fichier à table entièrement managée pour les ingénieurs données et les scientifiques des données. Vous pouvez déposer un fichier dans la zone managée du lakehouse. Le système le valide automatiquement pour les formats structurés pris en charge. Ensuite, le fichier est inscrit dans le metastore avec les métadonnées nécessaires telles que les noms de colonnes, les formats, la compression, et bien plus encore. (Le seul format pris en charge actuellement est la table Delta). Vous pouvez ensuite référencer le fichier sous la forme d’une table, puis utiliser la syntaxe SparkSQL pour interagir avec les données.

Interaction avec l’élément Lakehouse

Un ingénieur données peut interagir avec le lakehouse et les données dans le lakehouse de plusieurs façons :

En savoir plus sur les différentes façons de charger des données dans votre lakehouse : Options pour obtenir des données dans Fabric Lakehouse.

Multitâche avec lakehouse

L’expérience multitâche offre une apparence d’onglets de navigateur qui vous permet d’ouvrir et de basculer entre plusieurs éléments de manière transparente, ce qui vous permet de gérer votre data lakehouse plus efficacement que jamais. Plus besoin de jongler entre différentes fenêtres ni de perte du suivi de vos tâches. Lakehouse offre une expérience multitâche améliorée pour rendre votre parcours de gestion des données aussi efficace et convivial que possible avec les fonctionnalités suivantes :

  • Conserver les opérations en cours d’exécution : vous pouvez charger ou exécuter une opération de chargement de données dans un onglet et vérifier une autre tâche dans un autre onglet. Avec l’expérience multitâche améliorée, les opérations en cours d’exécution ne sont pas annulées lorsque vous naviguez entre les onglets. Vous pouvez vous concentrer sur votre travail sans interruption.

  • Conserver votre contexte : les objets, tables de données ou fichiers sélectionnés restent ouverts et facilement disponibles lorsque vous basculez entre les onglets. Le contexte de votre data lakehouse est toujours à portée de main.

  • Rechargement de liste non bloquant : un mécanisme de rechargement non bloquant pour vos listes de fichiers et de tables. Vous pouvez continuer à travailler pendant l’actualisation de la liste en arrière-plan. Cela garantit que vous disposez des données les plus récentes tout en vous offrant une expérience fluide et ininterrompue.

  • Notifications clairement définies : les notifications toast spécifient leur lakehouse d’origine, ce qui facilite le suivi des modifications et des mises à jour dans votre environnement multitâche.

Apparence de lakehouse accessible

L’accessibilité a toujours été une priorité absolue pour s’assurer que Lakehouse est inclusif et convivial pour tout le monde. Voici les principales initiatives que nous avons implémentées jusqu’à présent pour prendre en charge l’accessibilité :

  • Compatibilité avec les lecteurs d’écran : vous pouvez travailler en toute transparence avec les lecteurs d’écran populaires, ce qui permet aux utilisateurs malvoyants de naviguer et d’interagir efficacement avec notre plateforme.

  • Recréation de texte Une conception réactive qui s’adapte à différentes tailles d’écran et orientations. Le texte et le contenu sont recréés dynamiquement, ce qui facilite l’affichage et l’interaction avec notre application sur divers appareils.

  • Navigation au clavier : une navigation améliorée au clavier pour permettre aux utilisateurs de se déplacer dans le lakehouse sans dépendre d’une souris, ce qui améliore l’expérience des personnes souffrant de handicaps moteurs.

  • Texte de remplacement pour les images : toutes les images incluent désormais un texte de remplacement descriptif, ce qui permet aux lecteurs d’écran de transmettre des informations significatives.

  • Champs de formulaire et étiquettes : tous les champs de formulaire ont des étiquettes associées, ce qui simplifie l’entrée des données pour tous, y compris les utilisateurs de lecteurs d’écran.

Dans cet aperçu, vous obtiendrez une compréhension de base d’un lakehouse. Veuillez consulter l’article suivant si vous souhaitez découvrir comment créer et utiliser votre propre lakehouse :