Co je Data Factory v Microsoft Fabric?

Data Factory vám umožňuje používat moderní prostředí pro integraci dat k ingestování, přípravě a transformaci dat z bohaté sady zdrojů dat (například databází, datového skladu, Lakehouse, dat v reálném čase a dalších). Bez ohledu na to, jestli jste občan nebo profesionální vývojář, budete moct transformovat data pomocí inteligentních transformací a využívat bohatou sadu aktivit. Můžeme vytvořit kanály pro provádění jedné nebo více aktivit, přístup ke zdrojům dat nebo službám prostřednictvím propojených služeb a po vytvoření kanálu můžeme přidat triggery pro automatické spouštění procesů v určitých časech nebo v reakci na měnící se scénáře. S Data Factory v Microsoft Fabric přinášíme možnosti rychlého kopírování (přesunu dat) do toků dat i datových kanálů. Pomocí funkce Rychlé kopírování můžete přesouvat data mezi oblíbenými úložišti dat rychle. Nejdůležitější je, že funkce Fast Copy umožňuje přenést data do vašeho Lakehouse a Datového skladu v Microsoft Fabric pro účely analýzy.

Data Factory implementuje dvě primární základní funkce: toky dat a kanály.

  • Toky dat umožňují využít více než 300 transformací v návrháři toků dat, což vám umožní snadněji transformovat data a s větší flexibilitou než jakýkoli jiný nástroj , včetně inteligentních transformací dat založených na umělé inteligenci.
  • Datové kanály umožňují využívat předefinované funkce orchestrace dat k vytváření flexibilních pracovních postupů dat, které vyhovují potřebám vašeho podniku.

Datové toky

Toky dat poskytují rozhraní s nízkým kódem pro příjem dat ze stovek zdrojů dat a transformaci dat pomocí 300+ transformací dat. Výsledná data pak můžete načíst do několika cílů, jako jsou databáze Azure SQL a další. Toky dat je možné spouštět opakovaně pomocí ruční nebo plánované aktualizace nebo jako součást orchestrace datového kanálu.

Toky dat se vytvářejí pomocí známého prostředí Power Query , které je dnes dostupné napříč několika produkty a službami Microsoftu, jako jsou Excel, Power BI, Power Platform, Dynamics 365 Insights a další. Power Query umožňuje všem uživatelům od občanů po profesionální integrátory dat provádět příjem dat a transformace dat napříč jejich datovými aktivy. Umožňuje provádět spojení, agregace, čištění dat, vlastní transformace a mnoho dalšího od snadno použitelného, vysoce vizuálního a nízkokódového uživatelského rozhraní.

Snímek obrazovky uživatelského rozhraní Power BI zobrazující prostředí toku dat

Datové kanály

Datové kanály umožňují výkonné funkce pracovních postupů v cloudovém měřítku. S datovými kanály můžete vytvářet složité pracovní postupy, které můžou aktualizovat tok dat, přesouvat data velikosti PB a definovat sofistikované kanály toku řízení.

Pomocí datových kanálů můžete vytvářet složité pracovní postupy ETL a datové továrny, které můžou provádět mnoho různých úloh ve velkém měřítku. Možnosti toku řízení jsou integrované do datových kanálů, které umožňují vytvářet logiku pracovního postupu, která poskytuje smyčky a podmínky.

Přidejte aktivitu kopírování řízenou konfigurací společně s aktualizací toku dat s nízkým kódem v jednom kanálu pro kompletní datový kanál ETL. Můžete dokonce přidat aktivity založené na kódu pro poznámkové bloky Sparku, skripty SQL, uložené proc a další.

Snímek obrazovky uživatelského rozhraní zobrazující aktivitu kopírování

Pokud chcete začít s Microsoft Fabric, přejděte do rychlého startu: Vytvoření prvního toku dat Gen2 pro získání a transformaci dat.