Nastavení a správa katalogu Unity
Tento článek vysvětluje, jak nakonfigurovat a používat Katalog Unity ke správě dat v pracovním prostoru Azure Databricks. Je určen především pro správce pracovních prostorů, kteří používají katalog Unity poprvé.
Na konci tohoto článku budete mít:
- Pracovní prostor, který je povolený pro katalog Unity.
- Výpočetní prostředky, které mají přístup ke katalogu Unity.
- Uživatelé s oprávněním pro přístup k objektům a vytváření objektů v katalogu Unity.
Můžete si také projít další úvodní články:
- Rychlý návod, jak vytvořit tabulku a udělit oprávnění v katalogu Unity, najdete v tématu Kurz: Vytvoření první tabulky a udělení oprávnění.
- Klíčové koncepty katalogu Unity a úvod do fungování katalogu Unity najdete v tématu Co je Katalog Unity?.
- Informace o tom, jak nejlépe používat Katalog Unity ke splnění potřeb zásad správného řízení dat, najdete v osvědčených postupech katalogu Unity.
Poznámka:
Pokud chcete upgradovat existující pracovní prostor mimo Unity-Catalog na Katalog Unity, můžete využít UCX, projekt Databricks Labs, který poskytuje sadu pracovních postupů a nástrojů pro upgrade identit, oprávnění a tabulek na Katalog Unity. Viz Použití nástrojů UCX k upgradu pracovního prostoru na Katalog Unity.
Přehled povolení katalogu Unity
Pokud chcete použít katalog Unity, musí být pro Katalog Unity povolené pracovní prostory Azure Databricks, což znamená, že pracovní prostory jsou připojené k metastoru katalogu Unity, kontejneru nejvyšší úrovně pro metadata katalogu Unity.
Způsob, jakým správci nastavují katalog Unity, závisí na tom, jestli byl pracovní prostor automaticky povolený pro katalog Unity, nebo vyžaduje ruční povolení.
Automatické povolení katalogu Unity
Databricks začala automaticky povolovat nové pracovní prostory pro Katalog Unity 9. listopadu 2023 s postupným zaváděním napříč účty. Povolené pracovní prostory mají automaticky následující vlastnosti:
Automaticky zřízený metastor katalogu Unity (pokud metastor katalogu Unity již pro oblast pracovního prostoru existoval a metastor je povolený pro automatické přiřazení pracovního prostoru).
Výchozí oprávnění pro správce pracovního prostoru, například možnost vytvořit katalog nebo připojení k externí databázi.
Žádný správce metastoru (pokud se nepoužil existující metastore katalogu Unity a správce metastoru už byl přiřazený).
Žádné úložiště na úrovni metastoru pro spravované tabulky a spravované svazky (pokud nebyl použit existující metastore katalogu Unity s úložištěm na úrovni metastoru).
Katalog pracovních prostorů, který je původně zřízený, má název po vašem pracovním prostoru.
Všichni uživatelé ve vašem pracovním prostoru mohou vytvářet prostředky ve schématu
default
v tomto katalogu. Ve výchozím nastavení je tento katalog svázán s vaším pracovním prostorem, což znamená, že k němu lze přistupovat pouze prostřednictvím vašeho pracovního prostoru. Automatické zřizování katalogu pracovních prostorů při vytváření pracovního prostoru se postupně zavádí napříč účty.
Tyto výchozí konfigurace budou fungovat dobře pro většinu pracovních prostorů, ale všechny je může upravit správce pracovního prostoru nebo správce účtu. Správce účtu může například přiřadit správce metastoru a vytvořit úložiště na úrovni metastoru a správce pracovního prostoru může změnit název a přístup katalogu pracovních prostorů.
Co když můj pracovní prostor nebyl pro katalog Unity povolen automaticky?
Pokud váš pracovní prostor nebyl pro katalog Unity aktivován automaticky, musí správce účtu nebo správce metastoru pracovní prostor ručně připojit k metastoru katalogu Unity ve stejné oblasti. Pokud v dané oblasti neexistuje metastore katalogu Unity, musí ho vytvořit správce účtu. Pokyny najdete v tématu Vytvoření metastoru katalogu Unity.
Návody vědět, jestli byl můj pracovní prostor povolený pro katalog Unity?
Pokud chcete ověřit, jestli je pro katalog Unity povolený váš pracovní prostor, požádejte správce pracovního prostoru Azure Databricks nebo správce účtu, aby vás zkontroloval. Viz také krok 1: Potvrzení, že je váš pracovní prostor povolený pro katalog Unity.
Návody vědět, jestli můj pracovní prostor obsahuje katalog pracovních prostorů?
Některé nové pracovní prostory mají katalog pracovních prostorů, který je při původním zřízení pojmenován po vašem pracovním prostoru. Pokud chcete zjistit, jestli má váš pracovní prostor jeden, kliknutím na Katalog na bočním panelu otevřete Průzkumníka katalogu a vyhledejte katalog, který jako název katalogu používá název vašeho pracovního prostoru.
Poznámka:
Katalog pracovních prostorů je podobný jakémukoli jinému katalogu v katalogu Unity: správce pracovního prostoru může změnit jeho název, změnit jeho vlastnictví nebo ho dokonce odstranit. Nicméně hned po vytvoření pracovního prostoru nese název pracovního prostoru.
Než začnete
Než začnete s úlohami popsanými v tomto článku, měli byste se seznámit se základními koncepty katalogu Unity, včetně metastorů, rolí správců a spravovaného úložiště. Viz téma Co je katalog Unity?.
Měli byste také potvrdit, že splňujete následující požadavky:
Pracovní prostor Azure Databricks v plánu Premium
Následující role a oprávnění, která závisí na stavu vašeho pracovního prostoru:
Správce pracovního prostoru: Pokud byl váš pracovní prostor při vytváření automaticky povolen pro katalog Unity, musíte být správcem pracovního prostoru, abyste mohli dokončit požadované úkoly.
Správce účtu: Pokud váš pracovní prostor ještě není pro katalog Unity povolený, musí správce účtu pracovní prostor připojit k metastoru.
Pokud není ve stejné oblasti jako pracovní prostor žádný metastore katalogu Unity, musí správce účtu také vytvořit metastore katalogu Unity.
Pokyny k určení, jestli existuje metastor pro vaši oblast pracovního prostoru, spolu s pokyny k vytvoření metastoru, postupujte podle pokynů v tomto článku.
Podívejte se na oprávnění správce v katalogu Unity a automatické povolení katalogu Unity.
Krok 1: Potvrzení, že je váš pracovní prostor povolený pro katalog Unity
V tomto kroku určíte, jestli je váš pracovní prostor již povolený pro katalog Unity, kde je povolení definováno jako metastore katalogu Unity připojené k pracovnímu prostoru. Pokud pro katalog Unity není povolený váš pracovní prostor, musíte pracovní prostor pro Katalog Unity povolit ručně. Další kroky najdete v případě, že pro katalog Unity není povolený váš pracovní prostor.
Pokud to chcete potvrdit, udělejte jednu z následujících věcí.
Ověření povolení katalogu Unity pomocí konzoly účtu
- Jako správce účtu Azure Databricks se přihlaste ke konzole účtu.
- Klikněte na Pracovní prostory.
- Vyhledejte pracovní prostor a zkontrolujte sloupec Metastore . Pokud existuje název metastoru, je váš pracovní prostor připojený k metastoru katalogu Unity a proto je povolený pro katalog Unity.
Spuštěním dotazu SQL potvrďte povolení katalogu Unity.
V editoru dotazů SQL nebo poznámkovém bloku připojeném ke clusteru, který používá sdílený nebo jeden uživatelský režim přístupu, spusťte následující dotaz SQL. Viz režimy Accessu. Nevyžaduje se žádná role správce.
SELECT CURRENT_METASTORE();
Pokud dotaz vrátí ID metastoru podobné následujícímu, pak je váš pracovní prostor připojený k metastoru katalogu Unity, a proto je povolený pro katalog Unity.
Další kroky, pokud váš pracovní prostor není povolený pro katalog Unity
Pokud váš pracovní prostor není povolený pro katalog Unity (připojený k metastoru), další krok závisí na tom, jestli už máte metastor katalogu Unity definovaný pro vaši oblast pracovního prostoru:
- Pokud už váš účet obsahuje metastore katalogu Unity definovaný pro vaši oblast pracovního prostoru, můžete pracovní prostor jednoduše připojit k existujícímu metastoru. Přejděte na Povolit pracovní prostor pro Katalog Unity.
- Pokud pro oblast vašeho pracovního prostoru není definován žádný metastore katalogu Unity, musíte vytvořit metastor a pak pracovní prostor připojit. Přejděte na Vytvoření metastoru katalogu Unity.
Pokud je váš pracovní prostor povolený pro Katalog Unity, přejděte k dalšímu kroku.
Krok 2: Přidání uživatelů a přiřazení role správce pracovního prostoru
Uživatel, který pracovní prostor vytvoří, se automaticky přidá jako uživatel pracovního prostoru s rolí správce pracovního prostoru (to znamená uživatel v admins
místní skupině pracovního prostoru). Jako správce pracovního prostoru můžete přidávat a zvát uživatele do pracovního prostoru, přiřazovat roli správce pracovního prostoru jiným uživatelům a vytvářet instanční objekty a skupiny.
Správci účtů také můžou do pracovního prostoru přidávat uživatele, instanční objekty a skupiny. Může jim udělit roli správce účtu a správce metastoru.
Podrobnosti najdete v tématu Správa uživatelů.
(Doporučeno) Synchronizace identit na úrovni účtu z ID Microsoft Entra
Správa přístupu uživatelů k Azure Databricks může být pohodlná nastavením zřizování z Microsoft Entra ID. Úplné pokyny najdete v tématu Synchronizace uživatelů a skupin z ID Microsoft Entra.
Krok 3: Vytvoření clusterů nebo skladů SQL, které můžou uživatelé použít ke spouštění dotazů a vytváření objektů
Pokud chcete spouštět úlohy Katalogu Unity, musí výpočetní prostředky splňovat určité požadavky na zabezpečení. Nekompatibilní výpočetní prostředky nemají přístup k datům nebo jiným objektům v katalogu Unity. Sklady SQL vždy splňují požadavky na katalog Unity, ale některé režimy přístupu ke clusteru ne. Viz režimy Accessu.
Jako správce pracovního prostoru se můžete rozhodnout, že vytváření výpočetních prostředků se omezí na správce nebo umožníte uživatelům vytvářet vlastní sklady a clustery SQL. Můžete také vytvořit zásady clusteru, které uživatelům umožňují vytvářet vlastní clustery pomocí specifikací kompatibilních s katalogem Unity, které vynucujete. Přečtěte si informace o výpočetních oprávněních a vytváření a správě zásad výpočetních prostředků.
Krok 4: Udělení oprávnění uživatelům
Pokud chcete vytvářet objekty a přistupovat k nim v katalogech a schématech Unity, musí k tomu mít uživatel oprávnění. Tato část popisuje oprávnění uživatele a správce udělená v některých pracovních prostorech ve výchozím nastavení a popisuje, jak udělit další oprávnění.
Výchozí uživatelská oprávnění
Některé pracovní prostory mají při spuštění výchozí oprávnění uživatele (bez oprávnění správce):
Pokud je váš pracovní prostor spuštěný s automaticky zřízeným katalogem pracovních prostorů, můžou všichni uživatelé pracovního prostoru vytvářet objekty ve schématu katalogu
default
pracovních prostorů.Informace o tom, jak zjistit, jestli má váš pracovní prostor katalog pracovních prostorů, najdete v tématu Návody vědět, jestli můj pracovní prostor obsahuje katalog pracovních prostorů?.
Pokud byl váš pracovní prostor pro katalog Unity povolen ručně, automaticky se
main
zřídí katalog.Uživatelé pracovního prostoru mají
USE CATALOG
oprávnění kmain
katalogu, což neuděluje možnost vytvářet ani vybírat z objektů v katalogu, ale je předpokladem pro práci s libovolnými objekty v katalogu. Uživatel, který vytvořil metastore,main
ve výchozím nastavení vlastní katalog a může převést vlastnictví a udělit přístup jiným uživatelům.Pokud se po vytvoření metastoru přidá úložiště metastoru, nezřídí se žádný
main
katalog.
Ostatní pracovní prostory nemají ve výchozím nastavení žádné katalogy a ve výchozím nastavení nejsou povolená žádná uživatelská oprávnění bez oprávnění správce. Správce pracovního prostoru musí vytvořit první katalog a udělit uživatelům přístup k němu a objektům v něm. Než dokončíte kroky v této části, přeskočte k kroku 5: Vytvořte nové katalogy a schémata .
Výchozí oprávnění správce
Některé pracovní prostory mají při spuštění výchozí oprávnění správce pracovního prostoru:
- Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky:
- Správci pracovních prostorů můžou vytvářet nové katalogy a objekty v nových katalogech a udělovat jim přístup.
- Ve výchozím nastavení neexistuje žádný správce metastoru.
- Správci pracovního prostoru vlastní katalog pracovních prostorů (pokud existuje) a můžou udělit přístup k ho katalogu a všem objektům v daném katalogu.
- Pokud byl váš pracovní prostor pro Katalog Unity povolen ručně:
- Správci pracovních prostorů nemají ve výchozím nastavení žádná zvláštní oprávnění katalogu Unity.
- Správci metastoru musí existovat a mohou vytvořit libovolný objekt katalogu Unity a mohou převzít vlastnictví libovolného objektu katalogu Unity.
Seznam dalších oprávnění objektu udělených správcům pracovního prostoru v automaticky povolených pracovních prostorech katalogu Unity najdete v tématu Oprávnění správce pracovního prostoru, pokud jsou pracovní prostory povoleny pro katalog Unity automaticky.
Udělení oprávnění
Pro přístup k objektům jiným než objektům uvedeným v předchozích částech musí privilegovaný uživatel udělit tento přístup.
Pokud například chcete skupině udělit možnost vytvářet nová schémata, my-catalog
může vlastník katalogu spustit následující příkaz v editoru SQL nebo poznámkovém bloku:
GRANT CREATE SCHEMA ON my-catalog TO `data-consumers`;
Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky, správce pracovního prostoru vlastní katalog pracovních prostorů a může udělit možnost vytvářet nová schémata:
GRANT CREATE SCHEMA ON <workspace-catalog> TO `data-consumers`;
Oprávnění můžete také udělit a odvolat pomocí Průzkumníka katalogu.
Důležité
Nemůžete udělit oprávnění místnímu users
pracovnímu prostoru nebo admins
skupinám. Pokud chcete udělit oprávnění ke skupinám, musí se jednat o skupiny na úrovni účtu.
Podrobnosti o správě oprávnění v katalogu Unity najdete v tématu Správa oprávnění v katalogu Unity.
Krok 5: Vytvoření nových katalogů a schémat
Pokud chcete začít používat Katalog Unity, musíte mít definovaný aspoň jeden katalog. Katalogy jsou primární jednotkou izolace dat a organizace v katalogu Unity. Všechna schémata a tabulky jsou v katalogu aktivní, stejně jako objemy, zobrazení a modely.
Některé pracovní prostory nemají automaticky zřízený katalog. Pokud chcete použít Katalog Unity, musí správce pracovního prostoru vytvořit první katalog pro tyto pracovní prostory.
Ostatní pracovní prostory mají přístup k předem zřízenému katalogu, ke kterému mají vaši uživatelé přístup, aby mohli začít (buď katalog pracovních prostorů, nebo main
katalog, v závislosti na tom, jak byl váš pracovní prostor povolený pro katalog Unity). Když do Azure Databricks přidáte další data a prostředky AI, můžete vytvořit další katalogy pro seskupení těchto prostředků způsobem, který usnadňuje logické řízení dat.
Doporučení týkající se toho, jak nejlépe používat katalogy a schémata k uspořádání dat a prostředků AI, najdete v doporučených postupech katalogu Unity.
Jako správce metastoru, správce pracovního prostoru (pouze automaticky povolené pracovní prostory) nebo jiný uživatel s oprávněním CREATE CATALOG
můžete v metastoru vytvářet nové katalogy. Když to uděláte, měli byste:
Vytvořte spravované úložiště pro nový katalog.
Spravované úložiště je vyhrazené umístění úložiště ve vašem účtu Azure pro spravované tabulky a spravované svazky. Spravované úložiště můžete přiřadit k metastoru, katalogům a schématům. Když uživatel vytvoří tabulku, data se uloží do umístění úložiště, které je nejnižší v hierarchii. Pokud je například umístění úložiště definované pro metastor a katalog, ale nikoli schéma, data se ukládají v umístění definovaném pro katalog.
Databricks doporučuje přiřadit spravované úložiště na úrovni katalogu, protože katalogy obvykle představují logické jednotky izolace dat. Pokud jste obeznámeni s daty ve více katalogech, které sdílejí stejné umístění úložiště, můžete výchozí umístění úložiště na úrovni metastoru. Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky, ve výchozím nastavení neexistuje žádné úložiště na úrovni metastoru. Správce účtu má možnost nakonfigurovat úložiště na úrovni metastoru. Viz Určení spravovaného umístění úložiště v katalogu Unity a přidání spravovaného úložiště do existujícího metastoru.
Přiřazení spravovaného úložiště do katalogu vyžaduje, abyste vytvořili:
- Přihlašovací údaje k úložišti.
- Externí umístění , které odkazuje na přihlašovací údaje úložiště.
Úvod k těmto objektům a pokyny k jejich vytvoření najdete v tématu Připojení ke cloudovému úložišti objektů pomocí katalogu Unity.
Pokud chcete omezit přístup z jiných pracovních prostorů, které sdílejí stejný metastor, vytvořte vazbu nového katalogu s pracovním prostorem.
Viz Omezení přístupu katalogu ke konkrétním pracovním prostorům.
Udělte oprávnění k katalogu.
Podrobné pokyny najdete v tématu Vytváření katalogů.
Příklad vytvoření katalogu
Následující příklad ukazuje vytvoření katalogu se spravovaným úložištěm, následované udělením SELECT
oprávnění k katalogu:
CREATE CATALOG IF NOT EXISTS mycatalog
MANAGED LOCATION 'abfss://mycontainer@<myaccount.dfs.core.windows.net//depts/finance';
GRANT SELECT ON mycatalog TO `finance-team`;
Další příklady, včetně pokynů pro vytváření katalogů pomocí Průzkumníka katalogů, najdete v tématu Vytváření katalogů.
Vytvoření schématu
Schémata představují podrobnější seskupení (například oddělení nebo projekty) než katalogy. Všechny tabulky a další objekty katalogu Unity v katalogu jsou obsaženy ve schématech. Jako vlastník nového katalogu můžete chtít vytvořit schémata v katalogu. Místo toho ale můžete chtít delegovat možnost vytvářet schémata jiným uživatelům tím, že jim CREATE SCHEMA
udělíte oprávnění k katalogu.
Podrobné pokyny najdete v tématu Vytváření schémat.
(Volitelné) Přiřazení role správce metastoru
Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky, není ve výchozím nastavení přiřazena žádná role správce metastoru. Správci metastoru mají určitá oprávnění, která správci pracovního prostoru nemají.
Správce metastoru můžete chtít přiřadit, pokud potřebujete:
Změňte vlastnictví katalogů poté, co někdo opustí společnost.
Umožňuje spravovat a delegovat oprávnění pro inicializační skript a seznam povolených souborů JAR.
Delegujte možnost vytvářet katalogy a další oprávnění nejvyšší úrovně správcům mimo pracovní prostor.
Přijímat sdílená data prostřednictvím rozdílového sdílení
Používejte čisté pokoje.
Odeberte výchozí oprávnění správce pracovního prostoru.
Pokud nemá žádné úložiště, přidejte spravované úložiště do metastoru. Viz Přidání spravovaného úložiště do existujícího metastoru.
Podrobné informace o roli správce metastoru a pokyny pro jeho přiřazení najdete v tématu Přiřazení správce metastoru.
Upgrade tabulek v metastoru Hive na tabulky katalogu Unity
Pokud byl váš pracovní prostor ve službě předtím, než byl povolen pro katalog Unity, pravděpodobně obsahuje metastor Hive obsahující data, která chcete dál používat. Databricks doporučuje migrovat tabulky spravované metastorem Hive do metastoru katalogu Unity.
Viz Upgrade tabulek a zobrazení Hive na Katalog Unity a použití nástrojů UCX k upgradu pracovního prostoru na Unity Catalog.
(Volitelné) Pokračujte v práci s metastorem Hive
Pokud má váš pracovní prostor metastore Hive, který obsahuje data, která chcete dál používat, a rozhodnete se nepostupovat podle doporučení k upgradu tabulek spravovaných metastorem Hive na metastore katalogu Unity, můžete dál pracovat s daty v metastore Hive spolu s daty v metastore katalogu Unity.
Metastor Hive je reprezentován v rozhraních Katalogu Unity jako katalog s názvem hive_metastore
. Pokud chcete pokračovat v práci s daty v metastoru Hive, aniž byste museli aktualizovat dotazy pro zadání hive_metastore
katalogu, můžete nastavit výchozí katalog pracovního prostoru na hive_metastore
. Viz Správa výchozího katalogu.
V závislosti na tom, kdy byl váš pracovní prostor povolen pro katalog Unity, může již být hive_metastore
výchozí katalog .
(Volitelné) Vytvoření úložiště na úrovni metastoru
I když Databricks doporučuje vytvořit samostatné spravované umístění úložiště pro každý katalog v metastoru (a můžete to udělat stejně pro schémata), můžete místo toho zvolit vytvoření spravovaného umístění na úrovni metastoru a použít ho jako úložiště pro více katalogů a schémat.
Pokud chcete úložiště na úrovni metastoru, musíte také přiřadit správce metastoru. Viz (volitelné) Přiřazení role správce metastoru.
Úložiště na úrovni metastoru se vyžaduje pouze v případě, že platí následující:
- Poznámkové bloky chcete sdílet pomocí sdílení Databricks-to-Databricks Delta.
- Používáte integraci partnerského produktu Databricks, která závisí na osobních pracovních umístěních (zastaralé).
Další informace o hierarchii spravovaných umístění úložiště najdete v tématu Data jsou fyzicky oddělená v úložišti.
Informace o tom, jak přidat úložiště na úrovni metastoru do metastorů, které nemají žádné, najdete v tématu Přidání spravovaného úložiště do existujícího metastoru.
Poznámka:
Většina pracovních prostorů, které byly povoleny pro katalog Unity před 9. listopadem 2023, má kořen úložiště na úrovni metastoru.
Další kroky
- Spuštěním rychlého kurzu vytvořte první tabulku v katalogu Unity: Kurz: Vytvoření první tabulky a udělení oprávnění
- Další informace o katalogu Unity: Co je katalog Unity?
- Seznamte se s osvědčenými postupy pro používání katalogu Unity: Osvědčené postupy katalogu Unity
- Zjistěte, jak udělit a odvolat oprávnění: Správa oprávnění v katalogu Unity
- Naučte se vytvářet tabulky.
- Informace o upgradu tabulek Hive na katalog Unity
- Nainstalujte rozhraní příkazového řádku Databricks: Co je Rozhraní příkazového řádku Databricks?