Co je služba Azure Data Factory?
Začněme přehledem služby Azure Data Factory, který vám pomůže určit, jestli je vhodné data uspořádat a vytvořit obchodní přehledy.
Azure Data Factory je cloudová služba extrakce, transformace, načítání (ETL) a služby pro integraci dat, která pomáhá vytvářet pracovní postupy řízené daty pro:
- Orchestrace přesunu dat
- Transformujte data ve velkém měřítku.
Poznámka:
Pracovní postupy řízené daty se také označují jako kanály .
Pomocí služby Azure Data Factory můžete reorganizovat nezpracovaná data do smysluplných úložišť dat a datových jezer, což vám dává základ pro lepší obchodní rozhodnutí.
Co je analýza dat?
Analýza dat je proces shromažďování nezpracovaných dat a jejich zkoumání za účelem získání závěrů. Tento proces může být obtížné, pokud jsou data ve více umístěních, jako jsou hostované databáze a místní umístění.
Tip
Nezpracovaná data jsou data shromážděná ze zdroje a nezpracovala se. Někdy se označuje jako neorganizovaná data.
Azure poskytuje několik technologií, které můžete implementovat, aby vám pomohly s analýzou dat vaší organizace, včetně těchto:
- Azure Synapse Analytics
- Azure Blob Storage
- Azure Data Lake Storage
- Azure Data Lake Analytics
- Azure Analysis Services
- Azure HDInsight
- Azure Databricks
- Azure Machine Learning
Některé nebo všechny tyto služby můžete podle potřeby použít k analýze dat vaší organizace. Žádná z těchto služeb ale nesídí integraci dat. Integrace dat umožňuje shromažďovat data z více zdrojů a pak je načíst do umístění vhodného pro analýzu dat. V případě potřeby můžete data během tohoto procesu transformovat. I když tyto úlohy můžete provádět ručně, můžete zvážit použití služby Azure Data Factory.
Definice služby Azure Data Factory
Azure Data Factory je cloudová služba pro integraci dat navržená tak, aby řešila potřeby dvou konkrétních komunit, jak je popsáno v následující tabulce:
Komunita | Popis potřeb komunity |
---|---|
Komunita pro velké objemy dat | Tato komunita spoléhá na technologie pro správu velkých objemů různorodých dat. Azure Data Factory pro ně poskytuje způsob vytváření a spouštění kanálů v cloudu. Tyto kanály mají přístup ke cloudovým i místním datovým službám. Tyto kanály obvykle pracují s technologiemi, jako jsou Azure Synapse Analytics, Azure Blobs a Azure Data Lake. Azure HDInsight, Azure Databricks a Azure Machine Learning. |
Komunita relačních datových skladů | Tato komunita obvykle spoléhá na technologie, jako je Microsoft SQL Server. SQL Server Integration Services (SSIS) se často používá k vytváření balíčků SSIS. Azure Data Factory poskytuje této komunitě možnost spouštět balíčky SSIS v Azure a poskytuje jim přístup ke cloudovým i místním datovým službám. |
Poznámka:
Balíček se podobá kanálu Azure Data Factory. Každý balíček definuje proces pro extrakci, načtení, transformaci nebo jinou práci s daty.
Hlavním bodem je, že Azure Data Factory je jedna cloudová služba pro integraci dat. Poskytuje jednu sadu nástrojů a společné rozhraní pro správu pro veškerou integraci dat, které podporuje všechny vaše zdroje dat bez ohledu na to, kde se nacházejí:
- Azure
- Lokálně
- Platforma veřejného cloudu třetí strany
Jak může azure Data Factory pomoct s analýzou dat
Pomocí služby Azure Data Factory můžete:
Vytváření složitých procesů ETL Tyto procesy mohou vizuálně transformovat data pomocí toků dat nebo výpočetních služeb, jako jsou:
- Azure HDInsight Hadoop
- Azure Databricks
- Azure SQL Database
Publikujte tato transformovaná data do úložišť dat, aby aplikace business intelligence mohli využívat.
V následujícím obrázku jsou externí zdroje dat připojené ke službě Azure Data Factory. Objekt blob úložiště se používá k ingestování dat, zatímco Azure Synapse Analytics se používá jako úložiště. Tyto prvky poskytují orchestraci. Komponenty pro analýzu a vizualizaci, Azure Analysis Service a Power BI jsou také připojené ke službě Azure Data Factory.
Tip
Azure Data Factory poskytuje více než 90 integrovaných konektorů bez údržby.