Co jsou datové sklady v Microsoft Fabric?

Platí pro:✅ Koncový bod sql Analytics a sklad v Microsoft Fabric

Microsoft Fabric je řešení pro datové sklady nové generace v rámci Microsoft Fabric.

Sklad orientovaný na jezero je založený na distribuovaném procesoru na podnikové úrovni, který umožňuje špičkový výkon ve velkém měřítku a současně minimalizuje potřebu konfigurace a správy. Datový sklad Fabric umožňuje bezproblémovou spolupráci mezi datovými inženýry a firemními uživateli, aniž by to ovlivnilo zabezpečení nebo zásady správného řízení.

Snadno použitelné prostředí SaaS je také úzce integrované s Power BI pro snadnou analýzu a vytváření sestav, sblížení světa datových jezer a skladů a výrazně zjednodušuje investice organizací do svých analytických aktiv. 

Zákazníci datového skladu využívají:

  • Data uložená ve formátu Delta-parquet umožňují transakce ACID a interoperabilitu s jinými úlohami infrastruktury znamená, že nepotřebujete více kopií dat.
  • Dotazy napříč databázemi můžou používat více zdrojů dat pro rychlé přehledy s nulovou duplikací dat.
  • Snadné ingestování, načítání a transformace dat ve velkém měřítku prostřednictvím kanálů, toků dat, dotazů napříč databázemi nebo příkazu COPY INTO.
  • Autonomní správa úloh s špičkovým distribuovaným modulem pro zpracování dotazů znamená, že se nepřetáhnou k dosažení nejlepšího výkonu třídy.
  • Škálujte téměř okamžitě tak, aby splňovaly obchodní požadavky. Úložiště a výpočetní prostředky jsou oddělené.
  • Zkrátil se čas na přehledy s snadno použitelným a vždy připojeným sémantickým modelem, který je integrovaný s Power BI v režimu Direct Lake. Sestavy vždy obsahují nejnovější data pro analýzu a vytváření sestav.
  • Vytvořené pro libovolnou úroveň dovedností od občanského vývojáře po DBA nebo datového inženýra.

Položky datového skladu

Fabric Warehouse není tradiční podnikový datový sklad, je to lake warehouse, který podporuje dvě různé skladové položky: datový sklad Fabric a koncový bod analýzy SQL. Obě jsou účelově vytvořené tak, aby splňovaly obchodní potřeby zákazníků a současně poskytovaly nejlepší výkon třídy, minimalizovaly náklady a snížily administrativní režii.

Datový sklad Synapse

V pracovním prostoru Microsoft Fabric je datový sklad nebo sklad Synapse označený jako Sklad ve sloupci Typ . Pokud potřebujete plné možnosti napájení a transakcí (podpora dotazů DDL a DML) datového skladu, jedná se o rychlé a jednoduché řešení.

Snímek obrazovky znázorňující typ skladu v pracovním prostoru

Sklad lze naplnit některou z podporovaných metod příjmu dat, jako je COPY INTO, Pipelines, Dataflows nebo možnosti příjmu dat mezi databázemi, jako je CREATE TABLE AS SELECT (CTAS) nebo INSERT. VYBERTE NEBO SELECT INTO.

Pokud chcete začít se skladem, přečtěte si:

Koncový bod analýzy SQL pro Lakehouse

V pracovním prostoru Microsoft Fabric má každý Lakehouse automaticky vygenerovaný koncový bod analýzy SQL, který se dá použít k přechodu ze zobrazení Lakehouse (který podporuje přípravu dat a Apache Spark) do zobrazení SQL stejného Lakehouse k vytváření zobrazení zobrazení, funkcí, uložených procedur a použití zabezpečení SQL.

Snímek obrazovky znázorňující typ koncového bodu SQL Analytics v pracovním prostoru

Pomocí koncového bodu analýzy SQL lakehouse můžou příkazy T-SQL definovat a dotazovat datové objekty, ale ne manipulovat s daty ani je upravovat. V koncovém bodu analýzy SQL můžete provést následující akce:

  • Dotazujte se na tabulky, které odkazují na data ve složkách Delta Lake v jezeře.
  • Vytvářejte zobrazení, vložené tvfy a procedury pro zapouzdření sémantiky a obchodní logiky v T-SQL.
  • Umožňuje spravovat oprávnění k objektům.

Pokud chcete začít s koncovým bodem sql Analytics, přečtěte si:

Sklad nebo jezero

Při rozhodování mezi používáním skladu nebo jezera je důležité zvážit konkrétní potřeby a kontext požadavků na správu a analýzu dat. Stejně důležité, to není jednosměrné rozhodnutí!

Kdykoli budete mít příležitost přidat jeden nebo druhý v pozdějším okamžiku, pokud se vaše obchodní potřeby změní a bez ohledu na to, kde začnete, bude sklad i lakehouse používat stejný výkonný modul SQL pro všechny dotazy T-SQL.

Tady je několik obecných pokynů, které vám pomůžou při rozhodování:

  • Datový sklad vyberte, když potřebujete řešení na podnikové úrovni s otevřeným standardním formátem, bez výkonu uzlů a minimálního nastavení.  Nejvhodnější pro částečně strukturované a strukturované formáty dat je datový sklad vhodný pro začátečníky i zkušené odborníky na data a nabízí jednoduché a intuitivní prostředí.

  • Pokud potřebujete velké úložiště vysoce nestrukturovaných dat z heterogenních zdrojů, využijte nízkonákladové úložiště objektů a chcete spark používat jako primární vývojový nástroj. Jako jednoduchý datový sklad máte vždy možnost používat koncový bod SQL a nástroje T-SQL k poskytování scénářů generování sestav a datové inteligence ve vašem jezeře.

Podrobnější pokyny k rozhodování najdete v průvodci rozhodováním Microsoft Fabric: Volba mezi skladem a lakehousem.