Použití Microsoft Fabric ke čtení dat registrovaných v katalogu Unity
Tento článek poskytuje přehled o tom, jak pomocí Microsoft Fabric číst data zaregistrovaná v katalogu Unity.
Přehled integrace prostředků infrastruktury s katalogem Unity
Azure Databricks používá Azure Data Lake Storage Gen2 pro otevřené, přístupné a nízkonákladové úložiště. Katalog Unity spravuje a řídí tato data na základě uživatelem definovaných zásad. Microsoft Fabric umožňuje uživatelům číst některé z těchto tabulek registrovaných v katalogu Unity pomocí zástupce souboru.
Aby uživatelé mohli číst data registrovaná v katalogu Unity z fabric, vytvoří správce katalogu Fabric zástupce OneLake, které odkazují na data registrovaná v katalogu Unity. Ve funkci sdílení prostředků infrastruktury se vytvoří počáteční metodu handshake s otevřenými rozhraními API katalogu Unity pro endové přihlašovací údaje, které poskytují přístup k podkladovým cestám úložiště pro podporované tabulky. Po potvrzení metody handshake vytvoří Fabric zástupce OneLake k datům uloženým v Azure Data Lake Storage Gen2. Přihlašovací údaje, které poskytuje Katalog Unity, jsou krátkodobé, aktualizovány každou hodinu a je možné je odvolat pomocí katalogu Unity k odepření přístupu uživatelů Fabric.
Poznámka:
Pokud ke čtení dat registrovaných v katalogu Unity používáte Prostředky infrastruktury, je důležité pochopit následující skutečnosti:
- Zrcadlené položky katalogu Azure Databricks v prostředcích infrastruktury nereplikují data. Přihlašovací údaje pro přístup k datům se načítají z modulů Fabric na vyžádání pomocí rozhraní API katalogu Unity. Databricks poskytuje otevřenou platformu založenou na architektuře lakehouse: kopie dat se nevyžadují ani nedoporučuje.
- Moduly infrastruktury provádějí autorizaci s katalogem Unity pomocí krátkodobých přihlašovacích údajů svázaných s identitou uživatele, který připojení nakonfiguroval, a ne uživatele, který se dotazuje na skutečná data. Moduly infrastruktury nepoužívají zásady správného řízení a zabezpečení katalogu Unity pro uživatele Fabric. Jinými slovy, pokud je tabulka vystavená v prostředcích infrastruktury, žádné řízení přístupu v katalogu Unity v této tabulce platí pro uživatele Fabric. To může vést k potenciálnímu porušení zásad zabezpečení podnikových informací.
Než začnete
Pokud chcete získat přístup k datům katalogu Unity pomocí prostředků infrastruktury, musí mít uživatel, který konfiguruje připojení k Databricks z Prostředků infrastruktury, oprávnění k získání dočasných přihlašovacích údajů pomocí open API služby Unity Catalog open API.
To vyžaduje, aby konfigurující uživatel měl EXTERNAL USE SCHEMA
oprávnění ke schématu v katalogu Unity, který obsahuje tabulky, ke kterým se bude přistupovat z prostředků infrastruktury. Pokyny najdete v tématu Řízení externího přístupu k datům v katalogu Unity.
Poznámka:
Po vytvoření připojení nemusí mít k tomuto oprávnění přístup žádní uživatelé podřízených prostředků infrastruktury, kteří mají k tomuto připojení přístup, a efektivně tak obejít zásady správného řízení katalogu Unity.
Omezení
Použití prostředků infrastruktury ke čtení dat registrovaných v katalogu Unity nepodporuje následující:
- Stávající zásady zabezpečení katalogu Unity pro podřízené uživatele v Prostředcích infrastruktury
- Zobrazení, materializovaná zobrazení a tabulky streamování
- Katalogy pro sdílení delta
- Katalogy Federace Lakehouse.
- Tabulky s povolenými filtry na úrovni řádků nebo maskami sloupců
- Tabulky, které jako formát nepoužívají Delta Lake.
- Rodokmen katalogu Unity pro operace prováděné v prostředcích infrastruktury.
- Pracovní prostory Azure Databricks, které používají privátní koncové body nebo seznamy přístupu IP.
- Tabulky, jejichž podkladová služba Azure Data Lake Storage je za bránou firewall.
Použití prostředků infrastruktury také vyžaduje spuštěnou kapacitu Fabric k provádění kontrol a aktualizací metadat, což přináší další náklady.
Poznámka:
Tato omezení neplatí, pokud používáte Power BI Direct Query s registrovanými daty katalogu Unity. Viz Alternativy pro přístup k datům registrovaným v katalogu Unity.
Čtení dat katalogu Unity pomocí prostředků infrastruktury
Úplné pokyny najdete v dokumentaci Microsoftu ke konfiguraci zástupců prostředků infrastruktury.
Alternativy pro přístup k datům registrovaným v katalogu Unity
Azure Databricks používá Azure Data Lake Storage Gen2 pro otevřené, přístupné a nízkonákladové úložiště. Další informace najdete v doporučených postupech pro cloudové úložiště pomocí katalogu Unity. Pokud máte potíže s rizikovou expozicí a omezeními souvisejícími s funkcí sdílení prostředků infrastruktury, doporučujeme pro přístup k datům registrovaným v katalogu Unity následující cesty: