Jaká je struktura úložiště pro toky analytických dat?
Toky analytických dat ukládají data i metadata ve službě Azure Data Lake Storage. Toky dat využívají standardní strukturu k ukládání a popisu dat vytvořených v jezeře, která se nazývá složky Common Data Model. V tomto článku se dozvíte více o standardu úložiště, který toky dat používají na pozadí.
Úložiště potřebuje strukturu pro tok analytických dat.
Pokud je tok dat standardní, data se ukládají v Dataverse. Dataverse je jako databázový systém; má koncept tabulek, zobrazení atd. Dataverse je možnost strukturovaného úložiště dat používaná standardními toky dat.
Pokud je ale tok dat analytický, ukládají se data ve službě Azure Data Lake Storage. Data a metadata toku dat se ukládají do složky Common Data Model. Vzhledem k tomu, že v účtu úložiště může být uloženo více toků dat, zavedla se hierarchie složek a podsložek, která pomáhá uspořádat data. V závislosti na produktu, ve který byl tok dat vytvořen, můžou složky a podsložky představovat pracovní prostory (nebo prostředí) a potom složku Common Data Model toku dat. Ve složce Common Data Model se ukládají schémata i data tabulek toku dat. Tato struktura se řídí standardy definovanými pro Common Data Model.
Co je struktura úložiště Common Data Model?
Common Data Model je struktura metadat definovaná tak, aby přinesla konzistenci a konzistenci pro používání dat napříč několika platformami. Common Data Model není úložiště dat, je to způsob, jakým se data ukládají a definují.
Složky Common Data Model definují způsob uložení schématu tabulky a jejích dat. Ve službě Azure Data Lake Storage jsou data uspořádaná do složek. Složky můžou představovat pracovní prostor nebo prostředí. Pod těmito složkami se vytvoří podsložky pro každý tok dat.
Co je ve složce toku dat?
Každá složka toku dat obsahuje podsložku pro každou tabulku a soubor metadat s názvem model.json
.
Soubor metadat: model.json
Soubor model.json
je definice metadat toku dat. Toto je jeden soubor, který obsahuje všechna metadata toku dat. Obsahuje seznam tabulek, sloupců a jejich datových typů v každé tabulce, relaci mezi tabulkami atd. Tento soubor můžete snadno exportovat z toku dat, i když nemáte přístup ke struktuře složek Modelu Common Data Model.
Tento soubor JSON můžete použít k migraci (nebo importu) toku dat do jiného pracovního prostoru nebo prostředí.
Pokud chcete přesně zjistit, co soubor metadat model.json zahrnuje, přejděte k souboru metadat (model.json) pro Common Data Model.
Datové soubory
Kromě souboru metadat obsahuje složka toku dat i další podsložky. Tok dat ukládá data pro každou tabulku v podsložce s názvem tabulky. Data pro tabulku můžou být rozdělená do několika datových oddílů uložených ve formátu CSV.
Jak zobrazit nebo získat přístup ke složkám Common Data Model
Pokud používáte toky dat, které používají úložiště poskytované produktem, ve kterém byly vytvořeny, nebudete mít k těmto složkám přímý přístup. V takových případech vyžaduje získání dat z toků dat konektor Microsoft Power Platform dataflow dostupný v prostředí Získat data v produktech služba Power BI, Power Apps a Dynamics 35 Customer Přehledy nebo v Power BI Desktopu.
Pokud chcete zjistit, jak fungují toky dat a interní integrace Data Lake Storage, přejděte do toků dat a integrace Azure Data Lake (Preview).
Pokud vaše organizace povolila toky dat využívat svůj účet Data Lake Storage a byla vybrána jako cíl načítání pro toky dat, můžete data z toku dat získat i tak, že použijete konektor toku dat Power Platform, jak je uvedeno výše. Můžete ale také přistupovat ke složce Common Data Model toku dat přímo přes jezero, a to i mimo nástroje a služby Power Platform. Přístup k jezeře je možný prostřednictvím webu Azure Portal, Průzkumník služby Microsoft Azure Storage nebo jakékoli jiné služby nebo prostředí, které podporují Azure Data Lake Storage. Více informací: Připojení Azure Data Lake Storage Gen2 pro úložiště datového toku