Klávesové zkratky OneLake
Klávesové zkratky v Microsoft OneLake umožňují sjednotit data napříč doménami, cloudy a účty vytvořením jednoho virtuálního datového jezera pro celý podnik. Všechna prostředí Infrastruktury a analytické moduly se můžou přímo připojit k vašim existujícím zdrojům dat, jako jsou Azure, Amazon Web Services (AWS) a OneLake prostřednictvím sjednoceného oboru názvů. OneLake spravuje všechna oprávnění a přihlašovací údaje, takže nemusíte samostatně konfigurovat každou úlohu Fabric pro připojení ke každému zdroji dat. Kromě toho můžete pomocí klávesových zkratek eliminovat hraniční kopie dat a snížit latenci procesu spojenou s kopiemi dat a přípravou.
Co jsou klávesové zkratky?
Klávesové zkratky jsou objekty ve OneLake, které odkazují na jiná umístění úložiště. Umístění může být interní nebo externí pro OneLake. Umístění, na které zástupce odkazuje, se označuje jako cílová cesta zástupce. Umístění, kde se zástupce zobrazí, se označuje jako cesta zástupce. Klávesové zkratky se ve OneLake zobrazují jako složky a všechny úlohy nebo služby, které mají přístup k OneLake, je můžou používat. Klávesové zkratky se chovají jako symbolické odkazy. Jedná se o nezávislý objekt z cíle. Pokud zástupce odstraníte, cíl zůstane nedotčený. Pokud přesunete, přejmenujete nebo odstraníte cílovou cestu, může se zástupce přerušit.
Kde můžu vytvářet klávesové zkratky?
Klávesové zkratky můžete vytvářet v databázích lakehouse a dotazovací jazyk Kusto (KQL). Kromě toho klávesové zkratky, které vytvoříte v rámci těchto položek, můžou odkazovat na jiná umístění OneLake, Azure Data Lake Storage (ADLS) Gen2, Účty úložiště Amazon S3 nebo Dataverse. Můžete dokonce vytvořit zástupce místních nebo síťových umístění s použitím místní brány dat Infrastruktury (OPDG).
Pomocí uživatelského rozhraní Fabric můžete interaktivně vytvářet zástupce a pomocí rozhraní REST API můžete programově vytvářet zástupce.
Jezero
Při vytváření zástupců v jezeře musíte porozumět struktuře složek položky. Lakehouses se skládají ze dvou složek nejvyšší úrovně: složky Tabulky a složka Soubory . Složka Tables představuje spravovanou část jezerahouse, zatímco složka Files je nespravovaná část jezera. Ve složce Tabulky můžete vytvářet pouze zástupce na nejvyšší úrovni. Klávesové zkratky nejsou podporovány v jiných podadresářích složky Tabulky . Pokud cíl zástupce obsahuje data ve formátu Delta\Parquet, lakehouse automaticky synchronizuje metadata a rozpozná složku jako tabulku. Ve složce Soubory neexistují žádná omezení, kde můžete vytvářet zástupce. Můžete je vytvořit na libovolné úrovni hierarchie složek. Zjišťování tabulek se neprovádí ve složce Soubory .
Databáze KQL
Když vytvoříte zástupce v databázi KQL, zobrazí se ve složce Shortcuts databáze. Databáze KQL zpracovává klávesové zkratky, jako jsou externí tabulky. K dotazování zástupce použijte external_table
funkci dotazovací jazyk Kusto.
Kde můžu získat přístup ke zkratkám?
Všechny prostředky infrastruktury nebo jiné služby, které nemají přístup k datům ve OneLake, můžou používat klávesové zkratky. Zástupci jsou transparentní pro všechny služby, které přistupují k datům prostřednictvím rozhraní OneLake API. Klávesové zkratky se zobrazují jako jiná složka v jezeře. Při dotazování na data můžou všechny klávesové zkratky používat Apache Spark, SQL, inteligence v reálném čase a Analysis Services.
Apache Spark
Poznámkové bloky Apache Sparku a úlohy Apache Sparku můžou používat klávesové zkratky, které vytvoříte ve OneLake. Relativní cesty k souborům lze použít k přímému čtení dat ze zástupců. Pokud navíc vytvoříte zástupce v části Tabulky v lakehouse a je ve formátu Delta, můžete ji číst jako spravovanou tabulku pomocí syntaxe Apache Spark SQL.
df = spark.read.format("delta").load("Tables/MyShortcut")
display(df)
df = spark.sql("SELECT * FROM MyLakehouse.MyShortcut LIMIT 1000")
display(df)
Poznámka:
Formát Delta nepodporuje tabulky s mezerami v názvu. Jakákoli zkratka obsahující mezeru v názvu se v jezeře nezjistí jako tabulka Delta.
SQL
Klávesové zkratky můžete také přečíst v části Tabulky v jezeře prostřednictvím koncového bodu analýzy SQL pro lakehouse. Ke koncovému bodu analýzy SQL můžete přistupovat prostřednictvím selektoru režimu lakehouse nebo přes SQL Server Management Studio (SSMS).
SELECT TOP (100) *
FROM [MyLakehouse].[dbo].[MyShortcut]
Analýza v reálném čase
Klávesové zkratky v databázích KQL jsou rozpoznány jako externí tabulky. K dotazování zástupce použijte external_table
funkci dotazovací jazyk Kusto.
external_table('MyShortcut')
| take 100
Analysis Services
Můžete vytvořit sémantické modely pro objekty lakehouse obsahující zástupce v části Tabulky v jezeře. Když se sémantický model spustí v režimu Direct Lake, může služba Analysis Services číst data přímo z zástupce.
Jiné než prostředky infrastruktury
Aplikace a služby mimo Prostředky infrastruktury můžou také přistupovat ke zkratkám prostřednictvím rozhraní OneLake API. OneLake podporuje podmnožinu rozhraní API ADLS Gen2 a Blob Storage. Další informace o rozhraní OneLake API najdete v tématu Přístup k OneLake pomocí rozhraní API.
https://onelake.dfs.fabric.microsoft.com/MyWorkspace/MyLakhouse/Tables/MyShortcut/MyFile.csv
Typy klávesových zkratek
Klávesové zkratky OneLake podporují více zdrojů dat systému souborů. Patří mezi ně interní umístění OneLake, Azure Data Lake Storage (ADLS) Gen2, Amazon S3, S3 Compatible, Google Cloud Storage (GCS) a Dataverse.
Interní klávesové zkratky OneLake
Interní klávesové zkratky OneLake umožňují odkazovat na data v rámci existujících položek infrastruktury. Mezi tyto položky patří lakehouses, databáze KQL a datové sklady. Zástupce může odkazovat na umístění složky ve stejné položce, napříč položkami ve stejném pracovním prostoru nebo dokonce napříč položkami v různých pracovních prostorech. Když vytvoříte zástupce mezi položkami, typy položek se nemusí shodovat. Můžete například vytvořit zástupce v jezeře, který odkazuje na data v datovém skladu.
Když uživatel přistupuje k datům prostřednictvím zástupce jiného umístění OneLake, identita volajícího uživatele se použije k autorizaci přístupu k datům v cílové cestě zástupce*. Tento uživatel musí mít oprávnění v cílovém umístění ke čtení dat.
Důležité
Při přístupu ke zkratkám prostřednictvím sémantických modelů Power BI nebo T-SQL se identita volajícího uživatele nepředá do cíle zástupce. Místo toho se předá identita vlastníka volající položky a deleguje přístup volajícímu uživateli.
Klávesové zkratky ADLS
Zástupce je možné vytvořit také pro účty úložiště ADLS Gen2. Když vytváříte zástupce ADLS, cílová cesta může odkazovat na libovolnou složku v hierarchickém oboru názvů. Cílová cesta musí obsahovat minimálně název kontejneru.
Access
Klávesové zkratky ADLS musí odkazovat na koncový bod DFS pro účet úložiště.
Příklad: https://accountname.dfs.core.windows.net/
Pokud je váš účet úložiště chráněný bránou firewall úložiště, můžete nakonfigurovat přístup k důvěryhodným službám. Zobrazení přístupu k důvěryhodnému pracovnímu prostoru
Autorizace
Klávesové zkratky ADLS používají delegovaný autorizační model. V tomto modelu tvůrce zástupce určuje přihlašovací údaje pro zástupce ADLS a veškerý přístup k tomuto zástupci je autorizovaný pomocí těchto přihlašovacích údajů. Podporované delegovaný typy jsou účet organizace, klíč účtu, sdílený přístupový podpis (SAS) a instanční objekt.
- Účet organizace – musí mít v účtu úložiště roli Čtenář dat objektů blob služby Storage, Přispěvatel dat objektů blob služby Storage nebo Vlastník dat objektů blob služby Storage.
- Sdílený přístupový podpis (SAS) – musí obsahovat aspoň následující oprávnění: čtení, výpis a spuštění.
- Instanční objekt – musí mít v účtu úložiště roli Čtenář dat objektů blob služby Storage, Přispěvatel dat objektů blob úložiště nebo Vlastník dat objektů blob úložiště.
- Identita pracovního prostoru – musí mít v účtu úložiště roli Čtenář dat objektů blob služby Storage, Přispěvatel dat objektů blob služby Storage nebo Vlastník dat objektů blob služby Storage.
Poznámka:
Pro účet úložiště ADLS Gen2 musíte mít povolené hierarchické obory názvů.
Klávesové zkratky S3
Můžete také vytvořit zástupce účtů Amazon S3. Při vytváření zástupců Amazon S3 musí cílová cesta obsahovat minimálně název kontejneru. S3 nativně nepodporuje hierarchické obory názvů, ale k napodobení adresářové struktury můžete použít předpony. Do klávesové zkratky můžete zahrnout předpony pro další zúžení rozsahu dat přístupných prostřednictvím zástupce. Při přístupu k datům prostřednictvím zástupce S3 jsou předpony reprezentovány jako složky.
Access
Klávesové zkratky S3 musí odkazovat na koncový bod https kontejneru S3.
Příklad: https://bucketname.s3.region.amazonaws.com/
Poznámka:
Pro funkci zástupce S3 není nutné zakázat nastavení veřejného přístupu S3 blokovat veřejný přístup.
Přístup ke koncovému bodu S3 nesmí být blokován bránou firewall úložiště ani virtuálním privátním cloudem.
Autorizace
Klávesové zkratky S3 používají delegovaný autorizační model. V tomto modelu tvůrce zástupce určuje přihlašovací údaje pro zástupce S3 a veškerý přístup k tomuto zástupci je autorizovaný pomocí těchto přihlašovacích údajů. Podporované delegované přihlašovací údaje jsou klíč a tajný klíč pro uživatele IAM.
Uživatel IAM musí mít v kontejneru následující oprávnění, na které zástupce ukazuje.
S3:GetObject
S3:GetBucketLocation
S3:ListBucket
Poznámka:
Klávesové zkratky S3 jsou jen pro čtení. Nepodporují operace zápisu bez ohledu na oprávnění uživatele IAM.
Klávesové zkratky Google Cloud Storage
Klávesové zkratky je možné vytvořit ve službě Google Cloud Storage (GCS) pomocí rozhraní XML API pro GCS. Když vytváříte zástupce pro Google Cloud Storage, cílová cesta musí obsahovat minimálně název kontejneru. Rozsah zástupce můžete také omezit zadáním předpony nebo složky, na kterou chcete odkazovat v hierarchii úložiště.
Access
Při konfiguraci připojení pro zástupce GCS můžete zadat globální koncový bod služby úložiště nebo použít konkrétní koncový bod kontejneru.
- Příklad globálního koncového bodu:
https://storage.googleapis.com
- Příklad koncového bodu konkrétního kontejneru:
https://<BucketName>.storage.googleapis.com
Autorizace
Klávesové zkratky GCS používají delegovaný autorizační model. V tomto modelu tvůrce zástupce určuje přihlašovací údaje pro zástupce GCS a veškerý přístup k tomuto zástupci je autorizovaný pomocí těchto přihlašovacích údajů. Podporované delegované přihlašovací údaje jsou klíč HMAC a tajný klíč pro účet služby nebo uživatelský účet.
Účet musí mít oprávnění pro přístup k datům v kontejneru GCS. Pokud se pro zástupce použil konkrétní koncový bod kontejneru, musí mít účet následující oprávnění:
storage.objects.get
stoage.objects.list
Pokud se globální koncový bod použil v připojení pro zástupce, musí mít účet také následující oprávnění:
storage.buckets.list
Poznámka:
Klávesové zkratky GCS jsou jen pro čtení. Nepodporují operace zápisu bez ohledu na oprávnění použitého účtu.
Klávesové zkratky dataverse
Přímá integrace Dataverse s Microsoft Fabric umožňuje organizacím rozšířit své Dynamics 365 podnikových aplikací a obchodních procesů do Fabric. Tato integrace se provádí prostřednictvím zástupců, které je možné vytvořit dvěma způsoby: prostřednictvím portálu pro tvůrce PowerApps nebo přímo prostřednictvím prostředků infrastruktury.
Vytváření zástupců prostřednictvím portálu pro tvůrce PowerApps
Autorizovaní uživatelé PowerApps mají přístup k portálu pro tvůrce PowerApps a používají funkci Odkaz na Microsoft Fabric . Z této jediné akce se v prostředcích infrastruktury vytvoří objekt Lakehouse a klávesové zkratky se pro každou tabulku v prostředí Dataverse automaticky vygenerují. Další informace najdete v tématu Přímá integrace Dataverse s Microsoft Fabric.
Vytváření zástupců prostřednictvím prostředků infrastruktury
Uživatelé prostředků infrastruktury můžou také vytvářet zástupce služby Dataverse. V uživatelském rozhraní pro vytváření zástupců můžou uživatelé vybrat Dataverse, zadat adresu URL prostředí a procházet dostupné tabulky. Toto prostředí umožňuje uživatelům selektivně zvolit, které tabulky se mají přenést do prostředků infrastruktury, a ne přenést do všech tabulek.
Poznámka:
Tabulky Dataverse musí být nejprve k dispozici ve službě Dataverse Managed Lake, aby byly viditelné v uživatelském rozhraní pro vytváření klávesových zkratek v prostředcích infrastruktury. Pokud vaše tabulky nejsou z Prostředků infrastruktury viditelné, použijte funkci Odkaz na Microsoft Fabric z portálu pro tvůrce PowerApps.
Autorizace
Klávesové zkratky dataverse používají delegovaný autorizační model. V tomto modelu tvůrce zástupce určuje přihlašovací údaje pro zástupce Dataverse a veškerý přístup k tomuto zástupci je autorizovaný pomocí těchto přihlašovacích údajů. Podporovaným delegovaným typem přihlašovacích údajů je účet organizace (OAuth2). Účet organizace musí mít oprávnění správce systému pro přístup k datům ve službě Dataverse Managed Lake.
Poznámka:
Instanční objekty přidané do pracovního prostoru prostředků infrastruktury musí mít roli správce pro autorizaci zástupce Dataverse.
Ukládání do mezipaměti
Ukládání zástupců do mezipaměti se dá použít ke snížení nákladů na výchozí přenos dat související s přístupem k datům napříč cloudy. Vzhledem k tomu, že se soubory čtou externím zástupcem, jsou soubory uložené v mezipaměti pro pracovní prostor Fabric. Další požadavky na čtení se obsluhují z mezipaměti, nikoli ze vzdáleného poskytovatele úložiště. Soubory uložené v mezipaměti mají dobu uchovávání 24 hodin. Při každém přístupu k souboru dojde k resetování doby uchovávání. Pokud je soubor ve vzdáleném poskytovateli úložiště novější než soubor v mezipaměti, požadavek se obsluhuje od vzdáleného poskytovatele úložiště a aktualizovaný soubor se uloží do mezipaměti. Pokud k souboru není přístup více než 24 hodin, vymaže se z mezipaměti. Jednotlivé soubory větší než 1 GB se neukládají do mezipaměti.
Poznámka:
Ukládání zástupců do mezipaměti se v současné době podporuje jenom u klávesových zkratek kompatibilních s GCS, S3 a S3.
Pokud chcete povolit ukládání do mezipaměti pro zástupce, otevřete panel nastavení pracovního prostoru. Zvolte kartu OneLake. Přepněte nastavení mezipaměti na Zapnuto a vyberte Uložit.
Jak klávesové zkratky využívají cloudová připojení
Autorizace zástupce ADLS a S3 se deleguje pomocí cloudových připojení. Při vytváření nového zástupce ADLS nebo S3 buď vytvoříte nové připojení, nebo vyberete existující připojení pro zdroj dat. Nastavení připojení pro zástupce je operace vazby. Operaci vazby můžou provádět pouze uživatelé s oprávněním k připojení. Pokud nemáte oprávnění k připojení, nemůžete pomocí připojení vytvářet nové klávesové zkratky.
Zabezpečení zástupce
Klávesové zkratky vyžadují určitá oprávnění ke správě a používání. Zabezpečení zástupce OneLake sleduje oprávnění potřebná k vytvoření zástupců a přístupu k datům pomocí nich.
Jak klávesové zkratky zpracovávají odstranění?
Klávesové zkratky neprovádějí kaskádové odstranění. Když provedete operaci odstranění zástupce, odstraníte pouze objekt zástupce. Data v cíli zástupce zůstávají beze změny. Pokud ale provedete operaci odstranění u souboru nebo složky v rámci zástupce a máte oprávnění k provedení operace odstranění, soubory nebo složky se v cíli odstraní. Tuto situaci ukazuje následující příklad.
Příklad odstranění
Uživatel A má jezerní dům s následující cestou:
MyLakehouse\Files\MyShortcut\Foo\Bar
MyShortcut je zástupce, který odkazuje na účet ADLS Gen2, který obsahuje adresáře Foo\Bar .
Odstranění objektu zástupce
Uživatel A provede operaci odstranění na následující cestě:
MyLakehouse\Files\MyShortcut
V tomto případě se MyShortcut odstraní z jezera. Klávesové zkratky neprovádějí kaskádové odstranění, takže soubory a adresáře v účtu ADLS Gen2 zůstávají nedotčené.
Odstranění obsahu odkazovaného zástupcem
Uživatel A provede operaci odstranění na následující cestě:
MyLakehouse\Files\MyShortcut\Foo\Bar
Pokud má uživatel A v účtu ADLS Gen2 oprávnění k zápisu, odstraní se z účtu ADLS Gen2 adresář pruhu .
Zobrazení rodokmenu pracovního prostoru
Při vytváření zkratek mezi více položkami infrastruktury v pracovním prostoru můžete vizualizovat vztahy zástupců prostřednictvím zobrazení rodokmenu pracovního prostoru. Vyberte tlačítko zobrazení rodokmenu () v pravém horním rohu Průzkumníka pracovních prostorů.
Poznámka:
Zobrazení rodokmenu je vymezeno na jeden pracovní prostor. Zástupci umístění mimo vybraný pracovní prostor se nezobrazí.
Omezení a důležité informace
- Maximální počet zástupců na položku Fabric je 100 000. V tomto kontextu položka termínu odkazuje na: aplikace, jezeře, sklady, sestavy a další.
- Maximální počet zkratek v jedné cestě OneLake je 10.
- Maximální počet přímých zkratek pro klávesové zkratky je 5.
- Cílové cesty ADLS a S3 nemůžou obsahovat žádné rezervované znaky z dokumentu RFC 3986 oddílu 2.2. Povolené znaky naleznete v dokumentu RFC 3968 oddíl 2.3.
- Názvy zástupců OneLake, nadřazené cesty a cílové cesty nemohou obsahovat znaky %nebo +.
- Klávesové zkratky nepodporují jiné znaky než latinku.
- Kopírování rozhraní API objektů blob není podporováno pro zástupce ADLS nebo S3.
- Funkce kopírování nefunguje u zástupců, které přímo odkazují na kontejnery ADLS. Doporučujeme vytvořit zástupce ADLS pro adresář, který je alespoň na jedné úrovni pod kontejnerem.
- Další klávesové zkratky se nedají vytvořit uvnitř zástupců ADLS ani S3.
- Rodokmen pro zástupce datových skladů a sémantických modelů není v současné době k dispozici.
- Rozpoznávání nových zástupců rozhraní API pro tabulky může trvat až minutu.