Provozní kontinuita a zotavení po havárii pro Řešení Azure VMware

Tento scénář na podnikové úrovni pomáhá zlepšit provozní kontinuitu a zotavení po havárii (BCDR). Azure VMware Solution poskytuje privátní cloudy, které obsahují clustery VMware vSphere vytvořené z vyhrazené holé infrastruktury Azure. Řešení poskytuje minimálně tři hostitele ESXi, maximálně 16 hostitelů na cluster. Všechny zřízené privátní cloudy mají data center VMware vCenter Server, VMware vSAN, VMware vSphere a VMware NSX-T. Další informace o smlouvě o úrovni služeb (SLA) pro Azure VMware Solution najdete ve smlouvě SLA pro Azure VMware Solution.

Bez ohledu na to, jestli máte místní řešení nebo řešení Azure VMware, měli byste zvážit různé faktory BCDR, které se mají připravit na havárii. Robustní plán BCDR má chránit společnost před ztrátou dat, finanční ztrátou a výpadky, pokud dojde k rušivé události. Následující rozhodovací strom ukazuje různé možnosti BCDR dostupné pro Azure VMware Solution.

Diagram znázorňující vývojový diagram pro provozní kontinuitu a zotavení po havárii

Poznámka:

Pilotní light prostředí je nastavené s minimální konfigurací, která podporuje pouze základní komponenty pro podporu kritické sady aplikací. V případě převzetí služeb při selhání ale může škálovat na více hostitelů a pořídit více hostitelů. Pro zotavení po havárii úloh řešení Azure VMware náročných na výpočetní prostředky a paměť se vyžaduje stejné množství úložiště v sekundární lokalitě.

Aspekty návrhu provozní kontinuity

  • Zásady úložiště VMware vSAN ve službě Azure VMware Solution se implementují s ohledem na dostupnost úložiště. Pokud má cluster mezi třemi a pěti hostiteli, počet selhání hostitele, které lze tolerovat bez ztráty dat, se rovná jedné. Pokud má cluster mezi 6 a 16 hostiteli, počet chyb hostitele, které se mají tolerovat, než může dojít ke ztrátě dat, se rovná dvěma. Zásady úložiště VMware vSAN je možné použít pro jednotlivé virtuální počítače. I když jsou tyto zásady výchozí, můžete zásady změnit tak, aby vyhovovaly vlastním požadavkům. Další informace najdete v tématu Koncepty úložiště Azure VMware Solution.

  • Ve výchozím nastavení je ve službě Azure VMware Solution povolená vysoká dostupnost vSphere. Zásady pro přístup k vysoké dostupnosti si pro jeden uzel vyhrazuje výpočetní kapacitu a kapacitu paměti. Tato rezervace zajišťuje dostatečnou kapacitu pro restartování úloh v jiném uzlu v clusteru Azure VMware Solution.

  • Vysoká dostupnost s využitím roztaženého clusteru: U řešení Azure VMware se hostitelé ESXi nasazení ve standardním clusteru vSphere tradičně nacházejí v jedné zóně dostupnosti Azure a jsou chráněni vysokou dostupností vSphere. Úlohy ale nejsou chráněné proti selhání zóny dostupnosti. Kvůli ochraně před selháním může jeden cluster vSAN zahrnovat dvě samostatné zóny dostupnosti, označované jako roztažený cluster vSAN. Další informace najdete v tématu Nasazení roztažených clusterů vSAN.

  • Vyberte ověřené řešení zálohování pro virtuální počítače VMware vSphere, jako je Microsoft Azure Backup Server nebo partnerské řešení zálohování.

  • Informace o podporovanýchfunkcích

    Poznámka:

    Konfigurace privátního cloudu azure VMware Solution vCenter Serveru a HCX Manageru (pokud jsou povolené) jsou v denním plánu zálohování a konfigurace NSX je v hodinovém plánu zálohování. Zálohy se uchovávají minimálně tři dny.

  • Komponenty řešení Azure VMware, jako jsou vCenter Server, NSX-T Manager nebo HCX Manager, jsou spravované služby, pro které Azure spravuje zálohování. Pokud chcete provést obnovení ze zálohy, vytvořte žádost o podporu Azure.

Doporučení pro návrh provozní kontinuity

  • Pomocí Azure Backup Serveru zálohujte privátní cloud Azure VMware Solution. Další informace najdete v tématu Zálohování virtuálních počítačů VMware vSphere pomocí služby Azure Backup. Mezi podporované topologie nasazení patří agent MARS a Data Protection Manager. Každá topologie nasazení má svou vlastní matici podpory, omezení a omezení.

  • Nasaďte Azure Backup Server ve stejné oblasti Azure jako privátní cloud Azure VMware Solution. Tato metoda nasazení snižuje náklady na provoz, usnadňuje správu a udržuje primární nebo sekundární topologii. Osvědčené postupy nasazení oblastí Azure najdete v průvodci výběrem oblastí Azure.

  • Azure Backup je možné nasadit jako virtuální počítač IaaS (Infrastruktura jako služba) Azure nebo v privátním cloudu Azure VMware Solution. Důrazně doporučujeme ho nasadit mimo privátní cloud Azure VMware Solution. Nasaďte zálohování ve virtuální síti Azure a ujistěte se, že je tato virtuální síť připojená ke stejnému ExpressRoute, který je připojený k privátnímu cloudu Azure VMware Solution. Spuštění Backup Serveru mimo privátní cloud Azure VMware Solution pomáhá snížit spotřebu sítě vSAN, protože síť vSAN je omezený prostředek kapacity v rámci privátního cloudu Azure VMware Solution.

    Azure Backup Server nasazený jako virtuální počítač Azure IaaS

    Diagram znázorňující Azure Backup Server nasazený jako virtuální počítač Azure IaaS

    Azure Backup Server nasazený jako virtuální počítač Azure VMware Solution

    Diagram znázorňující Azure Backup Server nasazený jako virtuální počítač Azure VMware Solution

  • Kontrolní seznam požadavků na výkon aplikace vám umožní získat správnou kapacitu a typ disku, například HDD, SSD nebo Ultra. Zvažte skladovou položku virtuálního počítače Azure IaaS, která podporuje typ disku a kapacitu pro operace zálohování.

  • Pomocí Plánovače kapacity Azure Backup Serveru můžete určit počet serverů, úložiště a IOPS pro každý z nich. Při zadávání hodnoty "Celková velikost úlohy (GB)*" v Plánovači kapacity použijte medián hodnoty mezi použitým úložištěm a přidělenou úložištěm všech virtuálních počítačů ve vCenter, které chcete zálohovat.

  • Pro zvýšení IOPS a propustnosti disku použijte fondy úložiště se službou Azure Backup Server. Pro rozšířené operace používejte vrstvené úložiště na Backup Serveru. Nastavte hodnotu konfigurace DisableWriteAutoTiering na hodnotu 1 na svazku MABS, aby byla k dispozici celá úroveň výkonu pro ukládání metadat ReFS.

  • Určete počet paralelních úloh zálohování a operací obnovení, které se mají spustit na serveru Azure Backup. V současné době se podporuje osm paralelních úloh zálohování. Změřte dobu potřebnou k zálohování a obnovení důležitých úloh během několika spuštění. Ověřte, že časy zálohování a obnovení splňují požadavky RPO a RTO pro server Azure Backup. Ujistěte se, že úložiště dat AVS vSAN má dostatečnou kapacitu pro uložení obnovené zálohy.

  • Přidejte nezbytné výjimky antivirové ochrany pro soubory a složky Azure Backup Serveru, jak je uvedeno tady , pokud na Azure Backup Serveru běží nějaký antivirový software nebo antimalwarový software. Při použití agenta ochrany DPM na jakémkoli virtuálním počítači Azure VMware Solution pro zálohování aplikací (například SQL, SharePoint atd.) zakažte monitorování dpmra.exe v reálném čase.

  • Nakonfigurujte příslušná pravidla skupiny zabezpečení sítě (NSG) v podsíti hostující Azure Backup Server, aby umožňovala síťovou komunikaci z agenta ochrany DPM spuštěného na chráněném virtuálním počítači v Azure VMware Solution. Agent ochrany DPM komunikuje se službou Azure Backup Server na libovolném dynamickém portu mezi 1024 a 65535.

  • Azure Backup Server v současné době nepodporuje obnovení mezi oblastmi pro privátní cloud Azure VMware Solution. Informace o řešeních zálohování partnerů a zotavení po havárii najdete v případě, že je potřeba provést obnovení azure VMware Solution napříč oblastmi.

Aspekty návrhu zotavení po havárii

  • Sladění obchodních požadavků s cíli doby obnovení (RTO), kapacitou a cíli bodu obnovení (RPO) pro aplikace Podle toho naplánujte a navrhněte tyto cíle s využitím nejvhodnější technologie replikace. Například nativně replikujte databáze SQL pomocí skupiny dostupnosti SQL AlwaysOn nebo použijte nástroj pro zotavení po havárii, jako je VMware Site Recovery Manager.

  • Určete cílovou lokalitu pro zotavení po havárii pro chráněný privátní cloud Azure VMware Solution. Tato lokalita ovlivňuje nástroje pro zotavení po havárii vhodné pro prostředí. Pokud například chcete obnovit úlohy Azure VMware Solution na nativní virtuální počítače IaaS Azure, můžete zvážit Azure Site Recovery nebo Zerto.

  • Určete, která podmnožina úloh Azure VMware Solution vyžaduje ochranu, pokud dojde k události zotavení po havárii. Zvažte kategorizaci úloh na základě priority: P0 pro důležité obchodní úlohy a P1, P2, P3 pro jiné úlohy, které jsou důležité, ale ne jako kritické pro provoz firmy. Plán provozní kontinuity zákazníka definuje úrovně priority, které pomáhají řídit náklady spojené s implementací zotavení po havárii.

  • Ve většině případů nemusí neprodukční prostředí, jako je vývoj, testování nebo UAT, převzít služby při selhání sekundární lokalitě. Pilotní světlo byste měli spustit v sekundární lokalitě se sníženou kapacitou pro produkční a kritické úlohy, abyste ušetřili náklady. Pokud potřebujete větší kapacitu, můžete škálovat kapacitu a přidat hostitele ESXi do clusteru během události zotavení po havárii.

  • V případě nasazení pilotního světla se ujistěte, že jste zabezpečili veškerou kvótu hostitele potřebnou v sekundární lokalitě, abyste nemuseli čekat na požadovanou kapacitu během úplného horizontálního navýšení kapacity. Viz Kvóta hostitele požadavku pro Azure VMware Solution.

  • Nastavte v sekundárním prostředí funkční doménové role, jako jsou řadiče domény služby Active Directory.

  • Řešení od partnerů, jako je JetStream a Zerto, jsou obecně dostupná a ověřená v Řešení Azure VMware. Podporují většinu scénářů zotavení po havárii a umožňují rychlejší obnovení s téměř nulovým RPO.

  • VMware Site Recovery Manager, Jetstream a Zerto podporují migraci z umístění třetích stran do azure VMware Solution.

  • VMware HCX je také nákladově efektivní řešení zotavení po havárii. Nedoporučuje se ale pro velké produkční úlohy kvůli ruční orchestraci.

  • Pokud chcete zotavení po havárii mezi privátními cloudy Azure VMware Solution v různých oblastech Azure povolit expressRoute Global Reach mezi oběma back-endovými okruhy ExpressRoute. Tyto okruhy vytvářejí připojení privátního cloudu primárního k sekundárnímu, pokud jsou potřeba pro řešení, jako jsou VMware SRM a VMware HCX.

  • Pokud chcete zotavení po havárii mezi privátními cloudy Azure VMware Solution ve stejné oblasti Azure povolit, musíte povolit propojení Azure VMware Solution Interconnect. Vytvoří propojení směrování mezi sítěmi pro správu a úlohy privátních cloudů Azure VMware Solution pro komunikaci mezi cloudy. Ujistěte se, že směrovaný adresní prostor IP adres v každém privátním cloudu je jedinečný a nepřekrývá se.

  • Při práci s zotavením po havárii můžete použít stejný zdrojový adresní prostor IP adres v primární oblasti Azure a sekundární oblasti Azure. Vyžaduje však dodatečné úsilí o návrh a inženýrství.

    • Zachovat stejné IP adresy: Virtuální počítače v sekundární lokalitě Azure VMware Solution je možné obnovit pomocí stejné zdrojové IP adresy jako primární lokalita. Pro tuto metodu vytvořte izolované sítě VLAN nebo segmenty NSX-T v sekundární lokalitě a ujistěte se, že k prostředí nejsou připojené žádné z těchto izolovaných sítí VLAN nebo segmentů. Upravte trasy zotavení po havárii tak, aby odrážely, že se podsíť přesunula do sekundární lokality a do nového umístění IP adres. I když tato metoda funguje, vytváří také technické režie, když se zaměřuje na plně automatizované zotavení po havárii.

    • Použijte různé IP adresy: Pro obnovené virtuální počítače můžete také použít různé IP adresy. Pokud se virtuální počítač přesune do sekundární lokality, plán obnovení v rámci VMware Site Recovery Manageru podrobně popisuje vlastní mapování IP adres. Tuto mapu vyberte pro změnu IP adresy. Virtuální počítače se zobrazují v nových segmentech NSX-T a přiřazují se nové IP adresy. Nástroje se můžou lišit pro různá řešení zotavení po havárii.

  • Důležité faktory pro scénáře částečného a úplného zotavení po havárii:

    • VMware Site Recovery Manager podporuje částečné obnovení, které obnovuje pouze podmnožinu virtuálních počítačů a úplné zotavení po havárii. Mezi dvěma lokalitami řešení Azure VMware v oblasti 1 a 2 můžou převzít služby při selhání všechny nebo některé virtuální počítače.

    • Požadavek uchovávání zdrojových IP adres pro obnovené virtuální počítače určuje, jestli je možné částečné a úplné zotavení po havárii.

    • Aby bylo možné zachovat zdrojovou IP adresu při částečném zotavení po havárii v Site Recovery Manageru, musí se brána podsítě přesunout do sekundární lokality.

    Poznámka:

    Zotavení po havárii aktivní-pohotovostní nevyžaduje roztažení vrstvy 2.

Doporučení k návrhu zotavení po havárii

  • Při práci se službou Azure VMware Solution v primární i sekundární lokalitě použijte VMware Site Recovery Manager . Primární a sekundární lokality se také označují jako chráněné a obnovovací lokality.

    Základní přehled průběžné replikace vSphere

    Diagram znázorňující příklad průběžné replikace vSphere mezi dvěma lokalitami řešení Azure VMware

    Podrobný příklad průběžné replikace vSphere mezi primárními a sekundárními lokalitami

    Diagram znázorňující podrobný příklad průběžné replikace vSphere mezi dvěma lokalitami řešení Azure VMware

  • Pro důležité obchodní aplikace jsou Zerto a JetStream k dispozici jako řešení zotavení po havárii pro privátní cloud Azure VMware Solution. JetStream a Zerto jsou založené na základech nepřetržité ochrany dat (CDP) pomocí rozhraní VMware vSphere API pro rozhraní V/V Filtering (VAIO), které umožňuje minimální nebo téměř žádnou ztrátu dat. Umožňuje také nákladově efektivní zotavení po havárii pomocí minimálních prostředků.

  • Pokud jsou virtuální počítače Azure IaaS cílem zotavení po havárii pro privátní cloud Azure VMware Solution, použijte Azure Site Recovery nebo Zerto.

  • Minimalizujte ruční vstup pomocí automatizovaných plánů obnovení v rámci každého z příslušných řešení zotavení po havárii. Tyto plány jsou užitečné při práci s VMware Site Recovery Managerem nebo partnerskými řešeními. Plán obnovení shromažďuje počítače do skupin obnovení pro převzetí služeb při selhání. Pak pomáhá definovat systematický proces obnovení vytvořením nezávislých jednotek, které mohou převzít služby při selhání.

  • Nastavte orientační testy nebo postupy zotavení po havárii alespoň jednou za rok, abyste zajistili, že plány obnovení fungují podle očekávání. Možnosti orchestrace zvoleného nástroje pro zotavení po havárii určují úroveň úsilí spojeného se spouštěním těchto postupů.

  • Jako sekundární prostředí pro zotavení po havárii použijte geopolitické páry oblastí. Mezi výhody regionálních párů patří prioritní obnovení oblasti, postupné aktualizace, fyzická izolace a rezidence dat.

  • Adresní prostory se liší, aby se nepřekrývaly IP adresy mezi těmito dvěma lokalitami. Můžete například použít 192.168.0.0/16 oblast 1 a 10.0.0.0/16 pro oblast 2.

  • Použijte připojení ExpressRoute Global Reach mezi primárním a sekundárním privátním cloudem v různých oblastech. Další aspekty sítí a doporučení najdete v příslušné oblasti návrhu.

Další kroky

Seznamte se s aspekty a doporučeními pro počáteční nasazení řešení Azure VMware a pokyny pro provozní automatizaci.