Replikace a synchronizace mainframových dat do Azure

Azure Data Factory
Azure Databricks

Tato ukázková architektura popisuje plán implementace pro replikaci a synchronizaci dat během modernizace do Azure. Popisuje technické aspekty, jako jsou úložiště dat, nástroje a služby.

Architektura

Diagram architektury znázorňující synchronizaci místních dat a databází Azure během modernizace sálového počítače

Stáhněte si soubor aplikace Visio s touto architekturou.

Workflow

Sálové a střední systémy aktualizují místní aplikační databáze v pravidelných intervalech. Aby se zachovala konzistence, řešení synchronizuje nejnovější data s databázemi Azure. Proces synchronizace zahrnuje následující kroky:

  1. Dynamické kanály Azure Data Factory orchestrují aktivity, které se liší od extrakce dat po načítání dat. Můžete plánovat aktivity kanálu, spouštět je ručně nebo je aktivovat automaticky.

    Kanály seskupují aktivity, které provádějí úlohy. Data Factory dynamicky vytvoří pro každou místní tabulku jeden kanál, který extrahuje data. Při replikaci dat v Azure pak můžete použít masivně paralelní implementaci. Řešení můžete také nakonfigurovat tak, aby splňovalo vaše požadavky:

    • Úplná replikace: Replikujete celou databázi a provedete potřebné úpravy datových typů a polí v cílové databázi Azure.
    • Částečná, rozdílová nebo přírůstková replikace: K synchronizaci aktualizovaných řádků s databázemi Azure používáte sloupce vodoznaku ve zdrojových tabulkách. Tyto sloupce obsahují buď nepřetržitý přírůstek klíče, nebo časové razítko, které označuje poslední aktualizaci tabulky.

    Data Factory také používá kanály pro následující úlohy transformace:

    • Převod datového typu
    • Manipulace s daty
    • Formátování dat
    • Odvození sloupce
    • Zploštění dat
    • Řazení dat
    • Filtrování dat
  2. Místní databáze, jako je Db2 zOS, Db2 pro i a Db2 LUW, ukládají data aplikací.

  3. Místní prostředí Integration Runtime (SHIR) poskytuje prostředí, které služba Data Factory používá ke spouštění a odesílání aktivit.

  4. Azure Data Lake Storage Gen2 a Azure Blob Storage poskytují místo pro přípravu dat. Tento krok je někdy nutný k transformaci a sloučení dat z více zdrojů.

  5. Data Factory používá k přípravě dat azure Databricks, vlastní aktivity a toky dat kanálu k rychlé a efektivní transformaci dat.

  6. Data Factory načte do následujících relačních a nerelačních databází Azure:

    • Azure SQL
    • Azure Database for PostgreSQL
    • Azure Cosmos DB
    • Azure Data Lake Storage
    • Azure Database for MySQL
  7. SQL Server Integration Services (SSIS): Tato platforma může extrahovat, transformovat a načítat data.

  8. Nástroje jiné společnosti než Microsoft: Pokud řešení vyžaduje replikaci téměř v reálném čase, můžete použít nástroje jiné společnosti než Microsoft.

Komponenty

Tato část popisuje další nástroje, které můžete použít při modernizaci, synchronizaci a integraci dat.

Nástroje

  • Služba Microsoft service for Distributed Relational Database Architecture (DRDA) je součástí serveru HIS (Host Integration Server). Služba Microsoft pro DRDA je aplikační server, který používají klienti žádosti o aplikace DRDA (AR). Mezi příklady klientů DRDA AR patří IBM Db2 pro z/OS a Db2 pro i5/OS. Tito klienti používají aplikační server k převodu příkazů SQL db2 a jejich spuštění na SQL Serveru.

  • Pomocník s migrací SQL Serveru (SSMA) for Db2 automatizuje migraci z Db2 do databázových služeb Microsoftu. Když běží na virtuálním počítači, tento nástroj převede databázové objekty Db2 na databázové objekty SQL Serveru a vytvoří tyto objekty v SQL Serveru. SSMA pro Db2 pak migruje data z Db2 do následujících služeb:

    • SQL Server 2012
    • SQL Server 2014
    • SQL Server 2016
    • SQL Server 2017 ve Windows a Linuxu
    • SQL Server 2019 ve Windows a Linuxu
    • Azure SQL Database
  • Azure Synapse Analytics je analytická služba pro datové sklady a systémy pro velké objemy dat. Tento nástroj používá technologie Spark a má hlubokou integraci s Power BI, Azure Machine Learning a dalšími službami Azure.

Integrátory dat

  • Data Factory je hybridní služba pro integraci dat. Pomocí tohoto plně spravovaného bezserverového řešení můžete vytvářet, plánovat a orchestrovat pracovní postupy extrakce, transformace a načítání (ETL) a extrahovat, načítat a transformovat pracovní postupy ELT .

  • Azure Synapse Analytics je podniková analytická služba, která zrychluje dobu přehledu napříč datovými sklady a systémy pro velké objemy dat. Azure Synapse Analytics spojuje ty nejlepší z následujících technologií a služeb:

    • Technologie SQL, které používáte v podnikových datových skladech
    • Technologie Sparku, které používáte pro velké objemy dat.
    • Azure Data Explorer, který používáte pro analýzu protokolů a časových řad.
    • Azure Pipelines, které používáte pro integraci dat a pracovní postupy ETL a ELT.
    • Hloubková integrace s dalšími službami Azure, jako jsou Power BI, Azure Cosmos DB a Machine Learning.
  • SSIS je platforma pro vytváření řešení integrace a transformace dat na podnikové úrovni. SSIS můžete použít ke správě, replikaci, čištění a doly dat.

  • Azure Databricks je platforma pro analýzu dat. Je založená na opensourcovém opensourcovém systému distribuovaného zpracování Apache Sparku a je optimalizovaný pro cloudovou platformu Azure. V pracovním postupu analýzy Azure Databricks čte data z více zdrojů a pomocí Sparku poskytuje přehledy.

Úložiště dat

  • SQL Database je součástí řady Azure SQL a je sestavená pro cloud. Tato služba nabízí výhody plně spravované a evergreen platformy jako služby (PaaS). SQL Database také poskytuje automatizované funkce využívající AI, které optimalizují výkon a odolnost. Bezserverové výpočetní prostředky a možnosti úložiště Hyperscale automaticky škálujte prostředky na vyžádání.

  • Spravovaná instance Azure SQL je součástí portfolia služeb Azure SQL. Tato inteligentní a škálovatelná cloudová databázová služba kombinuje nejširší kompatibilitu modulu SQL Serveru se všemi výhodami plně spravované a evergreen PaaS. Se službou SQL Managed Instance můžete modernizovat stávající aplikace ve velkém měřítku.

  • SQL Server na virtuálních počítačích Azure nabízí způsob, jak přesunout úlohy SQL Serveru do cloudu s 100% kompatibilitou kódu. V rámci řady Azure SQL nabízí SQL Server ve službě Azure Virtual Machines kombinovaný výkon, zabezpečení a analýzu SQL Serveru s flexibilitou a hybridním připojením Azure. Pomocí SQL Serveru ve službě Azure Virtual Machines můžete migrovat existující aplikace nebo sestavovat nové aplikace. Můžete také získat přístup k nejnovějším aktualizacím a vydaným verzím SQL Serveru, včetně SQL Serveru 2019.

  • Azure Database for PostgreSQL je plně spravovaná relační databázová služba založená na komunitní edici opensourcového databázového stroje PostgreSQL . Tato služba slouží k zaměření na inovace aplikací místo správy databází. Úlohy můžete také rychle a snadno škálovat.

  • Azure Cosmos DB je globálně distribuovaná vícemodelová databáze. Pomocí služby Azure Cosmos DB se ujistěte, že vaše řešení můžou elasticky a nezávisle škálovat propustnost a úložiště napříč libovolným počtem geografických oblastí. Tato plně spravovaná databázová služba NoSQL zaručuje jednociferné latence milisekund na devadesátém percentilu kdekoli na světě.

  • Data Lake Storage je úložiště, které obsahuje velké množství dat v nativním nezpracovaném formátu. Úložiště Data Lake jsou optimalizovaná pro škálování na terabajty a petabajty dat. Data obvykle pocházejí z více heterogenních zdrojů a můžou být strukturovaná, částečně strukturovaná nebo nestrukturovaná. Data Lake Storage Gen2 kombinuje funkce Data Lake Storage Gen1 se službou Blob Storage. Toto řešení Data Lake nové generace poskytuje sémantiku systému souborů, zabezpečení na úrovni souborů a škálování. Nabízí také vrstvené úložiště, vysokou dostupnost a možnosti zotavení po havárii služby Blob Storage.

  • Azure Database for MySQL je plně spravovaná relační databázová služba založená na komunitní edici opensourcového databázového stroje MySQL.

  • Blob Storage poskytuje optimalizované cloudové úložiště objektů, které spravuje obrovské objemy nestrukturovaných dat.

Podrobnosti scénáře

Dostupnost a integrita dat jsou nezbytné v mainframové a střední modernizaci. Strategie zaměřené na data pomáhají udržet data nedotčená a dostupná během migrace do Azure. Abyste zabránili přerušení během modernizace, někdy potřebujete rychle replikovat data nebo udržovat místní data synchronizovaná s databázemi Azure.

Konkrétně se toto řešení týká:

  • Extrakce: Připojení ke zdrojové databázi a jeho extrahování.
  • Transformace:
    • Příprava: Dočasné ukládání dat v původním formátu a jejich příprava na transformaci.
    • Příprava: Transformace a manipulace s daty pomocí pravidel mapování, která splňují požadavky na cílovou databázi.
  • Načítání: Vkládání dat do cílové databáze

Potenciální případy použití

Mezi scénáře replikace dat a synchronizace, které můžou těžit z tohoto řešení, patří:

  • Architektury CQRS (Command Query Responsibility Segregation), které používají Azure ke službě všech kanálů inquire.
  • Prostředí, která testují místní aplikace a znovu hostují nebo rekonstruují aplikace paralelně.
  • Místní systémy s úzce propojenými aplikacemi, které vyžadují postupné nápravy nebo modernizaci.

Doporučení

Pokud k extrakci dat použijete službu Data Factory, proveďte kroky k vyladění výkonu aktivity kopírování.

Důležité informace

Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které je možné použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.

Mějte na paměti, když tuto architekturu považujete za vhodné.

Spolehlivost

Spolehlivost zajišťuje, že vaše aplikace může splňovat závazky, které uděláte pro vaše zákazníky. Další informace najdete v tématu Přehled pilíře spolehlivosti.

  • Správa infrastruktury, včetně dostupnosti, je automatizovaná v databázích Azure.

  • Informace o službě Microsoft Service pro ochranu drDA s podporou převzetí služeb při selhání najdete v tématu Sdružování a převzetí služeb při selhání .

  • Můžete clusterovat místní bránu dat a prostředí IR (Integration Runtime), abyste zajistili vyšší záruky dostupnosti.

Zabezpečení

Zabezpečení poskytuje záruky proti záměrným útokům a zneužití cenných dat a systémů. Další informace najdete v tématu Přehled pilíře zabezpečení.

  • Skupiny zabezpečení sítě slouží k omezení přístupu jenom na to, co každá služba potřebuje k fungování.

  • Pro služby PaaS používejte privátní koncové body . K doplnění zabezpečení služeb pro vaše služby použijte brány firewall služeb, které jsou dostupné i nedostupné prostřednictvím internetu.

  • Použití spravovaných identit pro toky dat komponent-komponent.

  • Informace o typech klientských připojení, která služba Microsoft Service for DRDA podporuje, najdete v tématu Plánování a navrhování řešení pomocí služby Microsoft Service for DRDA . Klientská připojení ovlivňují povahu transakcí, sdružování, převzetí služeb při selhání, ověřování a šifrování ve vaší síti.

Optimalizace nákladů

Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v tématu Přehled pilíře Optimalizace nákladů.

Provozní dokonalost

Efektivita provozu zahrnuje provozní procesy, které nasazují aplikaci a udržují ji spuštěnou v produkčním prostředí. Další informace najdete v tématu Přehled pilíře efektivity provozu.

  • Správa infrastruktury, včetně škálovatelnosti, je automatizovaná v databázích Azure.

  • Místní prostředí IR můžete škálovat přidružením logické instance k několika místním počítačům v režimu aktivní-aktivní.

Efektivita výkonu

Efektivita výkonu je schopnost úlohy škálovat se tak, aby efektivním způsobem splňovala požadavky, které na ni kladou uživatelé. Další informace najdete v tématu Přehled pilíře efektivity výkonu.

  • Pokud vaše implementace používá pro počáteční replikaci nebo průběžnou replikaci dat významnou šířku pásma, zvažte Azure ExpressRoute jako možnost ve velkém měřítku.

  • Zvolte správnou konfiguraci prostředí IR pro váš scénář.

Další kroky