Partagez des données à l'aide du protocole Delta Sharing Databricks-to-Databricks (pour les fournisseurs)

Cet article offre une vue d’ensemble de l’utilisation du protocole Delta Sharing Databricks-to-Databricks pour partager des données de manière sécurisée avec les utilisateurs de Databricks, quel que soit leur hôte de compte ou cloud, qui ont accès à un espace de travail activé pour Unity Catalog.

Remarque

Si vous êtes un destinataire de données (un utilisateur ou un groupe d'utilisateurs avec lequel les données Databricks sont partagées), consultez Accéder aux données partagées avec vous à l'aide de Delta Sharing (pour les destinataires).

À qui s’adresse l’utilisation de Delta Sharing Databricks-to-Databricks ?

Il existe trois façons de partager des données à l’aide de Delta Sharing.

  1. Le protocole de partage Databricks-to-Databricks, abordé dans cet article, vous permet de partager des données à partir de votre espace de travail compatible Unity Catalog avec des utilisateurs qui ont également accès à un espace de travail Databricks compatible Unity Catalog.

    Cette approche utilise le serveur Delta Sharing intégré à Azure Databricks. Elle prend en charge le partage de notebooks, la gouvernance des données Unity Catalog ainsi que l’audit et le suivi de l’utilisation pour les fournisseurs et les destinataires. L’intégration à Unity Catalog simplifie la configuration et la gouvernance pour les fournisseurs et les destinataires, et améliore les performances.

  2. Le protocole de partage ouvert Databricks vous permet de partager des données que vous gérez dans un espace de travail Databricks compatible Unity Catalog avec des utilisateurs sur n’importe quelle plateforme informatique.

    Consultez Partager des données à l’aide du protocole de partage ouvert Delta Sharing (pour les fournisseurs).

  3. Une implémentation gérée par le client du serveur Delta Sharing open source vous permet de partager de n’importe quelle plateforme vers n’importe quelle plateforme, qu’il s’agisse d’une plateforme Databricks ou non.

    Consultez github.com/delta-io/delta-sharing.

Pour une présentation du Delta Sharing et plus d’informations sur ces trois approches, consultez Qu’est-ce que le Delta Sharing ?.

Workflow du partage Delta Sharing Databricks-to-Databricks

Cette section offre une vue d’ensemble du workflow de partage Databricks-to-Databricks, et fournit des liens vers une documentation détaillée de chaque étape.

Dans le modèle Delta Sharing Databricks-to-Databricks :

  1. Un destinataire de données passe à un fournisseur de données l’identificateur de partage unique pour le metastore Databricks Unity Catalog qui est attaché à l’espace de travail Databricks que le destinataire (représentant un utilisateur ou un groupe d’utilisateurs) utilisera pour accéder aux données partagées par le fournisseur de données.

    Pour plus d’informations, consultez Étape 1 : Demander l’identificateur de partage du destinataire.

  2. Le fournisseur de données crée un partage dans le metastore Unity Catalog du fournisseur. Cet objet nommé contient une collection de tables, de vues, de volumes et de notebooks inscrits dans le metastore.

    Pour plus d’informations, consultez Créer et gérer des partages pour Delta Sharing.

  3. Le fournisseur de données crée un objet destinataire dans le metastore Unity Catalog du fournisseur. Cet objet nommé représente l’utilisateur ou le groupe d’utilisateurs devant accéder aux données incluses dans le partage, ainsi que l’identificateur de partage du metastore Unity Catalog qui est attaché à l’espace de travail qui sera utilisé par l’utilisateur ou le groupe d’utilisateurs pour accéder au partage. L’identificateur de partage est l’identificateur de clé qui active la connexion sécurisée.

    Pour plus d’informations, consultez Étape 2 : Créer le destinataire.

  4. Le fournisseur de données accorde au destinataire l’accès au partage.

    Pour plus de détails, veuillez consulter Gérer l’accès aux partages de données Delta Sharing (pour les fournisseurs).

  5. Le partage devient disponible dans l’espace de travail Databricks du destinataire, et les utilisateurs peuvent y accéder avec Catalog Explorer, l’interface CLI Databricks ou encore des commandes SQL dans un notebook Azure Databricks ou l’éditeur de requête SQL Databricks.

    Pour accéder aux tables, aux vues, aux volumes et notebooks dans un partage, un administrateur de metastore ou un utilisateur privilégié doit créer un catalogue à partir du partage. Ensuite, cet utilisateur ou un autre utilisateur disposant du privilège approprié peut donner à d’autres utilisateurs l’accès au catalogue et aux objets du catalogue. L’octroi d’autorisations sur les catalogues partagés et les ressources de données fonctionne comme avec toutes les autres ressources inscrites dans Unity Catalog, avec la distinction importante que les utilisateurs peuvent recevoir uniquement un accès en lecture sur les objets dans les catalogues créés à partir de partages Delta Sharing.

    Les notebooks partagés se trouvent au niveau du catalogue, et tout utilisateur disposant du privilège USE CATALOG sur le catalogue peut y accéder.

    Pour plus de détails, consultez Lire les données partagées à l’aide du partage Delta Databricks-to-Databricks (pour les destinataires).