Použití Microsoft Fabric ke čtení dat registrovaných v katalogu Unity

Tento článek poskytuje přehled o tom, jak pomocí Microsoft Fabric číst data zaregistrovaná v katalogu Unity.

Přehled integrace prostředků infrastruktury s katalogem Unity

Azure Databricks používá Azure Data Lake Storage Gen2 pro otevřené, přístupné a nízkonákladové úložiště. Katalog Unity spravuje a řídí tato data na základě uživatelem definovaných zásad. Microsoft Fabric umožňuje uživatelům číst některé z těchto tabulek registrovaných v katalogu Unity pomocí zástupce souboru.

Aby uživatelé mohli číst data registrovaná v katalogu Unity z fabric, vytvoří správce katalogu Fabric zástupce OneLake, které odkazují na data registrovaná v katalogu Unity. Ve funkci sdílení prostředků infrastruktury se vytvoří počáteční metodu handshake s otevřenými rozhraními API katalogu Unity pro endové přihlašovací údaje, které poskytují přístup k podkladovým cestám úložiště pro podporované tabulky. Po potvrzení metody handshake vytvoří Fabric zástupce OneLake k datům uloženým v Azure Data Lake Storage Gen2. Přihlašovací údaje, které poskytuje Katalog Unity, jsou krátkodobé, aktualizovány každou hodinu a je možné je odvolat pomocí katalogu Unity k odepření přístupu uživatelů Fabric.

Poznámka:

Pokud ke čtení dat registrovaných v katalogu Unity používáte Prostředky infrastruktury, je důležité pochopit následující skutečnosti:

  • Zrcadlené položky katalogu Azure Databricks v prostředcích infrastruktury nereplikují data. Přihlašovací údaje pro přístup k datům se načítají z modulů Fabric na vyžádání pomocí rozhraní API katalogu Unity. Databricks poskytuje otevřenou platformu založenou na architektuře lakehouse: kopie dat se nevyžadují ani nedoporučuje.
  • Moduly infrastruktury provádějí autorizaci s katalogem Unity pomocí krátkodobých přihlašovacích údajů svázaných s identitou uživatele, který připojení nakonfiguroval, a ne uživatele, který se dotazuje na skutečná data. Moduly infrastruktury nepoužívají zásady správného řízení a zabezpečení katalogu Unity pro uživatele Fabric. Jinými slovy, pokud je tabulka vystavená v prostředcích infrastruktury, žádné řízení přístupu v katalogu Unity v této tabulce platí pro uživatele Fabric. To může vést k potenciálnímu porušení zásad zabezpečení podnikových informací.

Než začnete

Pokud chcete získat přístup k datům katalogu Unity pomocí prostředků infrastruktury, musí mít uživatel, který konfiguruje připojení k Databricks z Prostředků infrastruktury, oprávnění k získání dočasných přihlašovacích údajů pomocí open API služby Unity Catalog open API.

To vyžaduje, aby konfigurující uživatel měl EXTERNAL USE SCHEMA oprávnění ke schématu v katalogu Unity, který obsahuje tabulky, ke kterým se bude přistupovat z prostředků infrastruktury. Pokyny najdete v tématu Řízení externího přístupu k datům v katalogu Unity.

Poznámka:

Po vytvoření připojení nemusí mít k tomuto oprávnění přístup žádní uživatelé podřízených prostředků infrastruktury, kteří mají k tomuto připojení přístup, a efektivně tak obejít zásady správného řízení katalogu Unity.

Omezení

Použití prostředků infrastruktury ke čtení dat registrovaných v katalogu Unity nepodporuje následující:

  • Stávající zásady zabezpečení katalogu Unity pro podřízené uživatele v Prostředcích infrastruktury
  • Zobrazení, materializovaná zobrazení a tabulky streamování
  • Katalogy pro sdílení delta
  • Katalogy Federace Lakehouse.
  • Tabulky s povolenými filtry na úrovni řádků nebo maskami sloupců
  • Tabulky, které jako formát nepoužívají Delta Lake.
  • Rodokmen katalogu Unity pro operace prováděné v prostředcích infrastruktury.
  • Pracovní prostory Azure Databricks, které používají privátní koncové body nebo seznamy přístupu IP.
  • Tabulky, jejichž podkladová služba Azure Data Lake Storage je za bránou firewall.

Použití prostředků infrastruktury také vyžaduje spuštěnou kapacitu Fabric k provádění kontrol a aktualizací metadat, což přináší další náklady.

Poznámka:

Tato omezení neplatí, pokud používáte Power BI Direct Query s registrovanými daty katalogu Unity. Viz Alternativy pro přístup k datům registrovaným v katalogu Unity.

Čtení dat katalogu Unity pomocí prostředků infrastruktury

Úplné pokyny najdete v dokumentaci Microsoftu ke konfiguraci zástupců prostředků infrastruktury.

Alternativy pro přístup k datům registrovaným v katalogu Unity

Azure Databricks používá Azure Data Lake Storage Gen2 pro otevřené, přístupné a nízkonákladové úložiště. Další informace najdete v doporučených postupech pro cloudové úložiště pomocí katalogu Unity. Pokud máte potíže s rizikovou expozicí a omezeními souvisejícími s funkcí sdílení prostředků infrastruktury, doporučujeme pro přístup k datům registrovaným v katalogu Unity následující cesty: