Provozní kontinuita a HADR pro SQL Server na virtuálních počítačích Azure

Platí pro: SQL Server na virtuálním počítači Azure

Tento článek porovnává a kontrastuje řešení provozní kontinuity jen pro Azure a hybridní provozní kontinuitu, která můžete použít pro zajištění vysoké dostupnosti a zotavení po havárii (HADR) s SQL Serverem na virtuálních počítačích Azure.

Provozní kontinuita znamená pokračování vaší firmy v případě havárie, plánování obnovení a zajištění vysoké dostupnosti vašich dat. SQL Server ve službě Azure Virtual Machines může pomoct snížit náklady na databázové řešení s vysokou dostupností a zotavením po havárii (HADR).

Poznámka:

Pomocí služby Azure Migrate je možné lift and shiftovat řešení instance clusteru s podporou převzetí služeb při selhání i řešení skupiny dostupnosti na SQL Server na virtuálních počítačích Azure.

Přehled

SQL Server na virtuálních počítačích Azure podporuje následující typ řešení:

  • Pouze Azure: Celý systém HADR běží v Azure.
  • Hybridní: Část řešení běží v Azure a druhá část běží místně ve vaší organizaci.

Flexibilita prostředí Azure umožňuje přesun částečně nebo zcela do Azure, abyste splnili požadavky na rozpočet a HADR databázových systémů SQL Serveru. Je na vás, abyste zajistili, že vaše databázové systémy mají funkce HADR, které splňují vaše obchodní požadavky na plánovanou dobu obnovení (RTO), cíl bodu obnovení (RPO) a smlouvu o úrovni služeb (SLA).

Integrované mechanismy vysoké dostupnosti poskytované Azure, jako je například opravy služeb pro cloudové služby a detekce zotavení po selhání pro virtuální počítače, nezaručují, že můžete splnit smlouvu SLA, RTO nebo RPO. I když tyto mechanismy pomáhají chránit vysokou dostupnost virtuálního počítače, nechrání dostupnost SQL Serveru spuštěného na virtuálním počítači. Instance SQL Serveru může selhat, když je virtuální počítač online a v pořádku. Dokonce i mechanismy vysoké dostupnosti poskytované Azure umožňují výpadky virtuálních počítačů kvůli událostem, jako je obnovení ze selhání softwaru nebo hardwaru a upgrady operačního systému.

Funkce provozní kontinuity

Následující tabulka uvádí funkce azure-only i hybridní SQL Server, které můžete použít pro vysokou dostupnost (HA), zotavení po havárii (DR) nebo obojí (HA/DR):

Tyto funkce SQL Serveru jsou podporované pro kontinuitu podnikových procesů v konfiguraci pouze v Azure nebo hybridní konfiguraci. Některé z možností jsou ideální pro vysokou dostupnost i zotavení po havárii (HA/DR), vysokou dostupnost (HA), zatímco jiné by se používaly pro zotavení po havárii (DR).

Funkce SQL Serveru Možnost vysoké dostupnosti a zotavení po havárii Detaily
Skupiny dostupnosti AlwaysOn Vysoká dostupnost a zotavení po havárii Poskytuje ochranu na úrovni databáze, zvyšuje vysokou dostupnost a zotavení po havárii přidáním replik do různých zón dostupnosti nebo oblastí.
Instance clusteru s podporou převzetí služeb při selhání alwaysOn (FCI) Vysoká dostupnost Používá sdílené úložiště k zajištění ochrany na úrovni instance. Zvyšte ochranu na úroveň databáze i instance kombinováním se skupinami dostupnosti.
Přesouvání protokolů Zotavení po havárii Ochrana na úrovni databáze pro zotavení po havárii zahrnuje odesílání záloh transakčních protokolů z primárního serveru a jejich obnovení na sekundární server. Potřebujete sdílenou složku Azure.
Zálohování a obnovení SQL Serveru s využitím služby Azure Blob Storage Zotavení po havárii Zálohy produkční databáze uložené v úložišti objektů blob v Azure pro ochranu zotavení po havárii
Azure Site Recovery Zotavení po havárii Řešení zotavení po havárii, které replikuje virtuální počítače z primární lokality do sekundární lokality.

Můžete kombinovat technologie pro implementaci řešení SQL Serveru, které má možnosti vysoké dostupnosti i zotavení po havárii. V závislosti na používané technologii může hybridní nasazení vyžadovat tunel VPN s virtuální sítí Azure. I když jsou technologie stejné, můžou existovat určité rozdíly v tom, jak jsou nastavené v Azure nebo v hybridním návrhu.

Skupiny dostupnosti (HADR)

Ochranu SQL Serveru na virtuálních počítačích Azure na úrovni databáze je možné provádět pomocí skupin dostupnosti jako řešení pro zajištění vysoké dostupnosti a zotavení po havárii (HADR). Repliky spuštěné na virtuálních počítačích Azure ve stejné oblasti poskytují vysokou dostupnost. Virtuální počítač řadiče domény je potřeba, protože clustering s podporou převzetí služeb při selhání s Windows vyžaduje doménu služby Active Directory.

Diagram znázorňující řadič domény nad clusterem WSFC z primární repliky, sekundární repliky a sdílené složky

Začněte tím, že si prohlédnete kurz skupiny dostupnosti.

V případě vyšší redundance, dostupnosti a ochrany zotavení po havárii je možné virtuální počítače Azure nasadit do různých zón dostupnosti, jak je uvedeno v přehledu skupiny dostupnosti. Rozšíření replik dostupnosti pro provoz napříč několika datovými centry na virtuálních počítačích Azure zvyšuje další pokrytí zotavení po havárii. Řešení napříč oblastmi pomáhá chránit před úplným výpadkem lokality.

Diagram znázorňující dvě oblasti s primární replikou a sekundární replikou propojenou asynchronním potvrzením

V rámci oblasti by všechny repliky měly být ve stejné cloudové službě a stejné virtuální síti. Vzhledem k tomu, že každá oblast má samostatnou virtuální síť, vyžadují tato řešení připojení k síti. Další informace najdete v tématu Konfigurace síťového připojení k síti pomocí webu Azure Portal. Podrobné pokyny najdete v tématu Konfigurace skupiny dostupnosti AlwaysOn SQL Serveru v různých oblastech Azure.

V hybridní konfiguraci se některé repliky dostupnosti spouští na virtuálních počítačích Azure a dalších replikách místně pro zotavení po havárii mezi lokalitami. Produkční lokalita může být buď místní, nebo v datacentru Azure.

Diagram skupin dostupnosti nakonfigurovaných z místního prostředí do Azure

Vzhledem k tomu, že všechny repliky dostupnosti musí být ve stejném clusteru s podporou převzetí služeb při selhání, musí cluster zahrnovat obě sítě (cluster s podporou převzetí služeb při selhání s více podsítěmi). Tato konfigurace vyžaduje připojení VPN mezi Azure a místní sítí.

Pro úspěšné zotavení po havárii databází byste také měli nainstalovat repliku řadiče domény v lokalitě pro zotavení po havárii. Začněte tím, že si prohlédnete kurz skupiny dostupnosti.

Instance clusteru s podporou převzetí služeb při selhání (HA)

SQL Server na virtuálních počítačích Azure podporuje instance clusteru s podporou převzetí služeb při selhání (FCI) a toto řešení poskytuje vysokou dostupnost na úrovni instance. Pro další ochranu můžete vytvořit redundanci na úrovni databáze i instance vytvořením skupin dostupnosti nad instancemi clusteru s podporou převzetí služeb při selhání. Funkce FCI vyžaduje sdílené úložiště a existuje pět řešení, která pracují s SQL Serverem na virtuálních počítačích Azure:

  • Použití sdílených disků Azure pro Windows Server 2019 Sdílené spravované disky jsou produktEm Azure, který umožňuje současně připojit spravovaný disk k více virtuálním počítačům. Virtuální počítače v clusteru můžou na základě rezervace zvolené clusterovou aplikací prostřednictvím trvalých rezervací SCSI (SCSI PR) číst nebo zapisovat na připojený disk. SCSI PR je standardní řešení úložiště, které používají aplikace běžící v místní síti SAN (Storage Area Network). Povolení žádosti o přijetí změn pomocí rozhraní SCSI na spravovaném disku umožňuje migrovat tyto aplikace do Azure tak, jak je.

  • Použití Prostory úložiště s přímým přístupem (S2D) k poskytnutí softwarové virtuální sítě SAN pro Windows Server 2016 a novější.

  • Použití sdílené složky Premium pro Windows Server 2012 a novější Sdílené složky úrovně Premium se zálohují na SSD, mají konzistentně nízkou latenci a plně se podporují pro použití s FCI.

  • Použití úložiště podporovaného partnerským řešením pro clustering Konkrétní příklad, který používá SIOS DataKeeper, najdete v blogové položce Clustering s podporou převzetí služeb při selhání a SIOS DataKeeper.

  • Použití sdíleného blokového úložiště pro vzdálený cíl iSCSI přes Azure ExpressRoute Například privátní úložiště NetApp (NPS) zveřejňuje cíl iSCSI prostřednictvím ExpressRoute s Equinix pro virtuální počítače Azure.

V případě řešení replikace sdíleného úložiště a dat od partnerů Microsoftu požádejte dodavatele o případné problémy související s přístupem k datům při převzetí služeb při selhání.

Začněte tím, že připravíte virtuální počítač na FCI.

Přesouvání protokolů (DR)

Dalším řešením zotavení po havárii v Azure je přesouvání protokolů, které automaticky odesílá zálohy transakčních protokolů z primární databáze na primárním serveru do jedné nebo více sekundárních databází na samostatném sekundárním serveru. Konfigurace přesouvání protokolů používá sdílenou složku Azure k ukládání záloh transakčních protokolů.

Diagram přesouvání protokolů v Azure

Pokud potřebujete nakonfigurovat přesouvání protokolů v hybridním prostředí, jeden server se nachází na virtuálním počítači Azure a druhý je místní pro zotavení po havárii mezi lokalitami. Přesouvání protokolů závisí na sdílení souborů Windows, takže se vyžaduje připojení VPN mezi virtuální sítí Azure a místní sítí.

Diagram expedice protokolu

Pro úspěšné zotavení po havárii databází byste také měli nainstalovat repliku řadiče domény v lokalitě pro zotavení po havárii.

Zálohování a obnovení (DR)

Zálohování produkčních databází je nezbytné pro zotavení po havárii. V Azure můžete zálohovat databáze přímo do úložiště objektů blob v jiném datacentru pro zotavení po havárii.

Diagram znázorňující databázi v jedné oblasti, která zálohuje do služby Blob Storage v jiné oblasti

V hybridním řešení je možné místní produkční databáze zálohovat přímo do úložiště objektů blob v Azure za účelem zotavení po havárii.

Diagram zálohování a obnovení

Další informace najdete v tématu Zálohování a obnovení SQL Serveru na virtuálních počítačích Azure.

Replikace s využitím Azure Site Recovery (DR)

Azure Site Recovery se dá použít jako řešení zotavení po havárii v Azure i v hybridní konfiguraci.

V Rámci Azure se produkční instance SQL Serveru v jednom datacentru Azure replikuje přímo do Azure Storage v jiném datacentru Azure pro zotavení po havárii.

Diagram znázorňující databázi v jednom datacentru Azure s využitím replikace Azure Site Recovery pro zotavení po havárii v jiném datacentru

V případě hybridních prostředí se místní produkční instance SQL Serveru replikuje přímo do Azure Storage kvůli zotavení po havárii.

Diagram replikace pomocí Azure Site Recovery

Další informace najdete v tématu Ochrana SQL Serveru pomocí zotavení po havárii SQL Serveru a Azure Site Recovery.

Bezplatná replika zotavení po havárii v Azure

Pokud máte Software Assurance, můžete s SQL Serverem implementovat plány hybridního zotavení po havárii bez dalších licenčních nákladů na pasivní instanci zotavení po havárii. Pokud jsou všechny repliky hostované v Azure, máte nárok také na bezplatnou repliku zotavení po havárii s průběžnými platbami.

Pokud jsou všechny tři repliky hostované v Azure, můžete mít například dva bezplatné pasivní sekundární soubory:

Diagram dvou bezplatných pasivních, když všechno v Azure

Nebo můžete nakonfigurovat prostředí hybridního převzetí služeb při selhání s licencovaným primárním místním prostředím, jednou bezplatnou pasivní dostupností pro vysokou dostupnost, jednou bezplatnou pasivní pro místní zotavení po havárii a jednou bezplatnou pasivní pro zotavení po havárii v Azure:

Diagram tří bezplatných pasivních, pokud je prostředí hybridní s jednou primární místní replikou

Další informace najdete v licenčních podmínkách produktu.

Pokud chcete tuto výhodu povolit, přejděte k prostředku virtuálního počítače s SQL Serverem. Vyberte Konfigurovat v části Nastavení a pak zvolte možnost HA/DR v části Licence SQL Serveru a pak vyberte Použít pro uložení nastavení. Pokud jsou všechny tři repliky hostované v Azure, zákazníci s průběžným platbami mají také nárok na používání typu licence HA/DR .

Diagram konfigurace repliky zotavení po havárii v Azure

Důležité aspekty SQL Serveru HADR v Azure

Virtuální počítače, úložiště a sítě Azure mají různé provozní charakteristiky než místní nevirtualizovaná IT infrastruktura. Úspěšná implementace řešení HADR SQL Serveru v Azure vyžaduje, abyste porozuměli těmto rozdílům a navrhli řešení tak, aby vyhovovalo.

Uzly s vysokou dostupností ve skupině dostupnosti

Skupiny dostupnosti v Azure umožňují umístit uzly s vysokou dostupností do samostatných domén selhání a aktualizačních domén. Platforma Azure přiřadí aktualizační doménu a doménu selhání každému virtuálnímu počítači ve vaší skupině dostupnosti. Tato konfigurace v rámci datacentra zajišťuje, že během plánované nebo neplánované události údržby je k dispozici alespoň jeden virtuální počítač a splňuje smlouvu SLA Azure o 99,95 procentech.

Pokud chcete nakonfigurovat nastavení vysoké dostupnosti, umístěte všechny zúčastněné virtuální počítače s SQL Serverem do stejné skupiny dostupnosti, abyste se vyhnuli ztrátě aplikací nebo dat během události údržby. Do stejné skupiny dostupnosti se můžou účastnit pouze uzly ve stejné cloudové službě. Další informace najdete v tématu Správa dostupnosti virtuálních počítačů.

Uzly s vysokou dostupností v zóně dostupnosti

Zóny dostupnosti jsou jedinečná fyzická umístění v rámci oblasti Azure. Každá zóna se skládá z jednoho nebo více datacenter vybavených nezávislým napájením, chlazením a sítěmi. Fyzické oddělení zón dostupnosti v rámci oblasti pomáhá chránit aplikace a data před selháním datacentra tím, že zajišťuje, že alespoň jeden virtuální počítač je k dispozici a splňuje smlouvu SLA Azure 99,99 %.

Pokud chcete nakonfigurovat vysokou dostupnost, umístěte zúčastněné virtuální počítače s SQL Serverem rozložené mezi zóny dostupnosti v dané oblasti. Za přenosy mezi sítěmi mezi zónami dostupnosti budou účtovány další poplatky. Další informace najdete v tématu Zóny dostupnosti.

Latence sítě v hybridním IT

Nasaďte řešení HADR s předpokladem, že mezi vaší místní sítí a Azure může docházet k období vysoké latence sítě. Při nasazování replik do Azure místo synchronního potvrzení pro režim synchronizace používejte asynchronní potvrzení. Když nasazujete servery zrcadlení databází jak místně, tak v Azure, použijte místo režimu vysoké bezpečnosti režim s vysokým výkonem.

Podívejte se na osvědčené postupy konfigurace HADR pro nastavení clusteru a HADR, které můžou pomoct přizpůsobit cloudové prostředí.

Podpora geografické replikace

Geografická replikace na discích Azure nepodporuje datový soubor a soubor protokolu stejné databáze, které se mají ukládat na samostatné disky. GRS replikuje změny na každém disku nezávisle a asynchronně. Tento mechanismus zaručuje pořadí zápisu v rámci jednoho disku v geograficky replikované kopii, ale ne napříč geograficky replikovanými kopiemi více disků. Pokud nakonfigurujete databázi tak, aby ukládal její datový soubor a jeho soubor protokolu na samostatné disky, můžou obnovené disky po havárii obsahovat aktuální kopii datového souboru než soubor protokolu, který přeruší protokol před zápisem na SQL Serveru a vlastnosti ACID (atomicity, konzistence, izolace a stálost) transakcí.

Pokud nemáte možnost zakázat geografickou replikaci v účtu úložiště, zachovejte všechna data a soubory protokolů pro databázi na stejném disku. Pokud kvůli velikosti databáze musíte použít více než jeden disk, nasaďte jedno z výše uvedených řešení pro zotavení po havárii, abyste zajistili redundanci dat.

Další kroky

Rozhodněte se, jestli je nejvhodnějším řešením provozní kontinuity pro vaši firmu skupina dostupnosti nebo instance clusteru s podporou převzetí služeb při selhání. Pak si projděte osvědčené postupy pro konfiguraci prostředí pro zajištění vysoké dostupnosti a zotavení po havárii.