Mise en miroir du catalogue Unity Azure Databricks (préversion)

De nombreuses organisations inscrivent aujourd’hui leurs données dans un catalogue Unity dans Azure Databricks. Un catalogue Unity mis en miroir dans Fabric permet au client de lire les données gérées par le catalogue Unity à partir des charges de travail Fabric. Azure Databricks et Fabric fonctionnent mieux ensemble.

Pour obtenir un tutoriel sur la configuration de votre espace de travail Azure Databricks pour la mise en miroir du catalogue Unity dans Fabric, consultez Tutoriel : configurer des bases de données mises en miroir Microsoft Fabric à partir d’Azure Databricks (préversion).

Les bases de données mises en miroir dans Fabric permettent aux utilisateurs de profiter d’un produit hautement intégré, de bout en bout et simple d’utilisation, conçu pour simplifier vos besoins en matière d’analyse. Vous pouvez profiter d’un produit simple d’utilisation conçu pour simplifier vos besoins d’analytique et conçu pour l’ouverture et la collaboration entre Microsoft Fabric et Azure Databricks.

Lorsque vous utilisez Fabric pour lire les données inscrites dans un catalogue Unity, il est important de comprendre qu’il n’existe aucun déplacement de données ou réplication de données. Seule la structure du catalogue Azure Databricks est mise en miroir sur Fabric et les données de catalogue sous-jacentes sont accessibles via des raccourcis. Par conséquent, les modifications apportées aux données sont reflétées immédiatement dans Fabric.

Quelles expériences d’analytique sont intégrées ?

Les catalogues mis en miroir sont un élément de l’entrepôt de données de Fabric distinct de l’entrepôt et du point de terminaison de l’analytique SQL.

Lorsque vous mettez en miroir un catalogue Unity Azure Databricks, Fabric crée trois éléments :

Vous pouvez accéder à vos données Azure Databricks mises en miroir de plusieurs façons :

  • Chaque élément Azure Databricks mis en miroir a un point de terminaison d’analytique SQL généré automatiquement qui fournit une expérience analytique enrichie créée par le processus de mise en miroir. Utilisez des commandes T-SQL pour définir et interroger des objets de données à partir du point de terminaison d’analytique SQL en lecture seule.
  • Utilisez Power BI avec le mode Direct Lake pour créer des rapports sur l’élément Azure Databricks.

Synchronisation des métadonnées

Lorsque vous créez une base de données mise en miroir à partir d’Azure Databricks dans Fabric, par défaut, la synchronisation automatique des modifications futures du catalogue pour le schéma sélectionné est activée. Les modifications de métadonnées suivantes sont reflétées depuis votre espace de travail Azure Databricks vers Fabric si la synchronisation automatique est activée :

  • Ajout de schémas à un catalogue.
  • Suppression de schémas d’un catalogue.
  • Ajout de tables à un schéma.
  • Suppression de tables d’un schéma.

Sélection de schéma/table :

  • Par défaut, l’ensemble du catalogue est sélectionné lorsque l’utilisateur ajoute le catalogue.
  • L’utilisateur peut exclure certaines tables dans le schéma.
  • Désélectionner un schéma désélectionne toutes les tables du schéma.
  • Si l’utilisateur revient et sélectionne le schéma, toutes les tables du schéma sont à nouveau sélectionnées.
  • Le même comportement de sélection s’applique aux schémas d’un catalogue.

Il existe d’autres conditions de filtrage appliquées aux catalogues/schémas/tables :

  • Les vues matérialisées et les tables de diffusion en continu ne sont pas affichées.
  • Les tables externes qui ne prennent pas en charge le format Delta ne sont pas affichées.