Dela data med hjälp av Protokollet Delta Sharing Databricks-to-Databricks (för leverantörer)

Den här artikeln ger en översikt över hur du använder Databricks-till-Databricks Delta-delning för att dela data på ett säkert sätt med alla Databricks-användare, oavsett konto eller molnvärd, så länge användaren har åtkomst till en arbetsyta som är aktiverad för Unity Catalog.

Kommentar

Om du är en datamottagare (en användare eller grupp av användare som Databricks-data delas med) kan du läsa Åtkomstdata som delas med dig med deltadelning (för mottagare).

Vem ska använda Databricks-till-Databricks Delta-delning?

Det finns tre sätt att dela data med deltadelning.

  1. Med delningsprotokollet Databricks-till-Databricks, som beskrivs i den här artikeln, kan du dela data från din Unity Catalog-aktiverade arbetsyta med användare som också har åtkomst till en Unity Catalog-aktiverad Databricks-arbetsyta.

    Den här metoden använder deltadelningsservern som är inbyggd i Azure Databricks och ger stöd för delning av notebook-filer, Datastyrning i Unity Catalog, granskning och användningsspårning för både leverantörer och mottagare. Integreringen med Unity Catalog förenklar konfigurationen och styrningen för både leverantörer och mottagare och förbättrar prestandan.

  2. Med databricks öppna delningsprotokoll kan du dela data som du hanterar på en Unity Catalog-aktiverad Databricks-arbetsyta med användare på alla databehandlingsplattformar.

    Se Dela data med hjälp av deltadelningsprotokollet för öppen delning (för leverantörer).

  3. Med en kundhanterad implementering av deltadelningsservern med öppen källkod kan du dela från valfri plattform till valfri plattform, oavsett om det är Databricks eller inte.

    Se github.com/delta-io/delta-sharing.

En introduktion till Deltadelning och mer information om dessa tre metoder finns i Vad är deltadelning?.

Databricks-till-Databricks Delta-delningsarbetsflöde

Det här avsnittet innehåller en översikt på hög nivå över databricks-till-Databricks-delningsarbetsflödet, med länkar till detaljerad dokumentation för varje steg.

I Databricks-till-Databricks Delta-delningsmodellen:

  1. En datamottagare ger en dataleverantör den unika delningsidentifieraren för metaarkivet Databricks Unity Catalog som är kopplat till Databricks-arbetsytan som mottagaren (som representerar en användare eller grupp av användare) använder för att komma åt de data som dataleverantören delar.

    Mer information finns i Steg 1: Begär mottagarens delningsidentifierare.

  2. Dataprovidern skapar en resurs i leverantörens Unity Catalog-metaarkiv. Det här namngivna objektet innehåller en samling tabeller, vyer, volymer och notebook-filer som registrerats i metaarkivet.

    Mer information finns i Skapa och hantera resurser för deltadelning.

  3. Dataprovidern skapar ett mottagarobjekt i providerns Unity Catalog-metaarkiv. Det här namngivna objektet representerar den användare eller grupp av användare som kommer åt data som ingår i resursen, tillsammans med delningsidentifieraren för Unity Catalog-metaarkivet som är kopplat till arbetsytan som användaren eller gruppen av användare kommer att använda för att komma åt resursen. Delningsidentifieraren är nyckelidentifieraren som aktiverar den säkra anslutningen.

    Mer information finns i Steg 2: Skapa mottagaren.

  4. Dataleverantören ger mottagaren åtkomst till resursen.

    Mer information finns i Hantera åtkomst till deltadelningsdataresurser (för leverantörer).

  5. Resursen blir tillgänglig på mottagarens Databricks-arbetsyta och användarna kan komma åt den med hjälp av Catalog Explorer, Databricks CLI eller SQL-kommandon i en Azure Databricks-notebook-fil eller Databricks SQL-frågeredigeraren.

    För att få åtkomst till tabeller, vyer, volymer och notebook-filer i en resurs måste en metaarkivadministratör eller privilegierad användare skapa en katalog från resursen. Sedan kan den användaren eller en annan användare som beviljas rätt behörighet ge andra användare åtkomst till katalogen och objekten i katalogen. Att bevilja behörigheter för delade kataloger och datatillgångar fungerar precis som med andra tillgångar som är registrerade i Unity Catalog, och den viktiga skillnaden är att användare endast kan beviljas läsbehörighet för objekt i kataloger som skapas från Delta-delningsresurser.

    Delade notebook-filer finns på katalognivå och alla användare med behörighet i USE CATALOG katalogen kan komma åt dem.

    Mer information finns i Läsa data som delas med Databricks-till-Databricks Delta-delning (för mottagare).