Partager des données à l’aide du protocole de partage ouvert Delta Sharing (pour les fournisseurs)

Cet article donne une vue d’ensemble de la façon dont les fournisseurs peuvent utiliser le protocole de partage ouvert Delta Sharing pour partager des données de l’espace de travail Azure Databricks compatible Unity Catalog avec n’importe quel utilisateur, sur n’importe quelle plateforme informatique, n’importe où.

Remarque

Si vous êtes un destinataire de données (un utilisateur ou un groupe d’utilisateurs avec lequel les données sont partagées), consultez Accéder aux données partagées avec vous à l’aide de Delta Sharing (pour les destinataires) à la place.

À qui s’adresse l’utilisation du protocole de partage ouvert Delta Sharing ?

Il existe trois façons de partager des données à l’aide de Delta Sharing :

  1. Le protocole de partage ouvert Databricks, abordé dans cet article, vous permet de partager des données que vous gérez dans un espace de travail Databricks compatible Unity Catalog avec des utilisateurs sur n’importe quelle plateforme informatique.

    Cette approche repose sur le serveur Delta Sharing intégré à Azure Databricks. Elle est utile quand vous gérez des données avec Unity Catalog, et que vous souhaitez les partager avec des utilisateurs qui ne se servent pas de Databricks, ou qui n’ont pas accès à un espace de travail Databricks compatible Unity Catalog. L’intégration à Unity Catalog côté fournisseur simplifie la configuration et la gouvernance pour les fournisseurs.

  2. Une implémentation gérée par le client du serveur Delta Sharing open source vous permet de partager de n’importe quelle plateforme vers n’importe quelle plateforme, qu’il s’agisse d’une plateforme Databricks ou non.

    Consultez github.com/delta-io/delta-sharing.

  3. Le protocole de partage Databricks-to-Databricks vous permet de partager des données à partir de votre espace de travail compatible Unity Catalog avec des utilisateurs qui ont également accès à un espace de travail Databricks compatible Unity Catalog.

    Consultez Partager des données à l’aide du protocole Delta Sharing Databricks-to-Databricks (pour les fournisseurs).

Pour une présentation du Delta Sharing et plus d’informations sur ces trois approches, consultez Qu’est-ce que le Delta Sharing ?.

Workflow du protocole Delta Sharing de partage ouvert

Cette section fournit une vue d’ensemble générale du workflow de partage ouvert, avec des liens vers la documentation détaillée de chaque étape.

Dans le modèle du protocole Delta Sharing de partage ouvert :

  1. Le fournisseur de données crée un destinataire. Il s’agit d’un objet nommé qui représente un utilisateur ou un groupe d’utilisateurs avec lesquels le fournisseur de données souhaite partager des données.

    Quand le fournisseur de données crée le destinataire, Azure Databricks génère un jeton, un fichier d’informations d’identification comprenant le jeton et un lien d’activation que le fournisseur de données peut envoyer au destinataire afin d’accéder au fichier d’informations d’identification.

    Pour plus d’informations, consultez Étape 1 : créer le destinataire.

  2. Le fournisseur de données crée un partage. Il s’agit d’un objet nommé comprenant une collection de tables inscrites dans un metastore Unity Catalog du compte du fournisseur.

    Pour plus d’informations, consultez Créer et gérer des partages pour Delta Sharing.

  3. Le fournisseur de données accorde au destinataire l’accès au partage.

    Pour plus de détails, veuillez consulter Gérer l’accès aux partages de données Delta Sharing (pour les fournisseurs).

  4. Le fournisseur de données envoie le lien d’activation au destinataire via un canal sécurisé, ainsi que des instructions d’utilisation du lien d’activation permettant de télécharger le fichier d’informations d’identification. Le destinataire utilise ce fichier pour établir une connexion sécurisée avec le fournisseur de données afin de recevoir les données partagées.

    Pour plus d’informations, consultez Étape 2 : obtenir le lien d’activation.

  5. Le destinataire des données suit le lien d’activation afin de télécharger le fichier d’informations d’identification, puis il l’utilise pour accéder aux données partagées.

    Les données partagées sont disponibles en lecture seule. Les utilisateurs peuvent accéder aux données à l’aide de la plateforme ou des outils de leur choix.

    Pour plus d’informations, consultez Lire les données partagées à l’aide du partage ouvert Delta Sharing (pour les destinataires).

Considérations relatives à la configuration et à la sécurité pour le partage ouvert

Une gestion correcte des jetons est essentielle pour partager des données des manière sécurisée dans le cas du modèle de partage ouvert :

  • Les fournisseurs de données qui ont l’intention d’utiliser le partage ouvert doivent configurer la durée de vie par défaut du jeton du destinataire quand ils activent Delta Sharing pour leur metastore Unity Catalog. Databricks vous recommande de configurer les jetons pour qu’ils expirent. Consultez Activer Delta Sharing sur un metastore.
  • Si vous devez modifier la durée de vie par défaut du jeton, consultez Modifier la durée de vie du jeton du destinataire.
  • Encouragez les destinataires à gérer le fichier d’informations d’identification téléchargé de façon sécurisée.
  • Pour plus d’informations sur la gestion des jetons et la sécurité du partage ouvert, consultez Gérer les jetons de destinataire (partage ouvert).

Les fournisseurs de données peuvent renforcer la sécurité en attribuant des listes d’accès IP pour restreindre l’accès des destinataires à des emplacements réseau spécifiques. Voir Restreindre l’accès des destinataires Delta Sharing à l’aide de listes d’accès IP (partage ouvert).