Zotavení po havárii pomocí nástroje Aplikace Azure lication Consistent Snapshot
Tento článek vysvětluje, jak provést zotavení po havárii při použití nástroje Aplikace Azure lication Consistent Snapshot, který můžete použít se službou Azure NetApp Files.
Důležité
Tato operace se vztahuje pouze na velkou instanci Azure.
Úvod
Platforma Azure Large Instance může mít také nakonfigurovanou lokalitu zotavení po havárii, do které je možné replikovat snímky svazků úložiště. Pokud byly snímky s takovou instalací správně nakonfigurované, je možné provést zotavení po havárii v této lokalitě. Tento dokument je určený jako průvodce provedením zotavení po havárii pro toto nastavení.
Předpoklady pro nastavení zotavení po havárii
Před plánováním převzetí služeb při selhání zotavení po havárii je nutné splnit následující požadavky.
- V lokalitě zotavení po havárii máte zřízený uzel zotavení po havárii. Existují dvě možnosti zotavení po havárii. Jeden je normální DR a druhý je multipurpose DR.
- Replikace úložiště funguje. Provozní tým Microsoftu provádí nastavení replikace úložiště v době automatického zřizování zotavení po havárii. Replikaci úložiště můžete monitorovat pomocí příkazu
azacsnap -c details --details replication
v lokalitě zotavení po havárii. - Nastavili a nakonfigurovali jste snímky úložiště v primárním umístění.
- Máte v lokalitě zotavení po havárii nainstalovanou instanci HANA pro primární server se stejným identifikátorem SID jako primární instance.
- Čtete a rozumíte postupu převzetí služeb při selhání zotavení po havárii popsanému ve velkých instancích SAP HANA s vysokou dostupností a zotavením po havárii v Azure.
- V umístění zotavení po havárii jste nastavili a nakonfigurovali snímky úložiště.
- Konfigurační soubor (například
DR.json
) byl vytvořen se svazky úložiště zotavení po havárii a přidruženými informacemi na serveru zotavení po havárii. - Dokončili jste kroky v lokalitě zotavení po havárii a provedli jste následující kroky:
- Povolte komunikaci s úložištěm.
- Povolte komunikaci se SAP HANA.
Nastavení zotavení po havárii
Microsoft podporuje replikaci na úrovni úložiště pro zotavení po havárii. Existují dva způsoby, jak nastavit zotavení po havárii.
Jeden je normální a druhý je multipurpose. V normálním stavu zotavení po havárii máte vyhrazenou instanci v umístění zotavení po havárii pro převzetí služeb při selhání. Ve scénáři zotavení po havárii s více účely máte v lokalitě zotavení po havárii spuštěnou jinou instanci HANA pro kontrolu kvality nebo vývojovou instanci HANA. Zároveň jste ale nainstalovali předinstalovanou instanci HANA, která je neaktivní a má stejný identifikátor SID jako instance HANA, kterou chcete převzít při selhání do této jednotky velké instance HANA. Operace Microsoftu nastaví prostředí pro vás, včetně replikace úložiště na základě vstupu poskytnutého ve formuláři žádosti o služby (SRF) v době registrace.
Důležité
Ujistěte se, že jsou splněny všechny požadavky pro instalaci zotavení po havárii.
Monitorování replikace dat z primární lokality do lokality zotavení po havárii
Provozní tým Microsoftu už spravuje a monitoruje propojení zotavení po havárii z primární lokality do lokality zotavení po havárii.
Pomocí příkazu azacsnap -c details --details replication
snapshot můžete monitorovat replikaci dat z primárního serveru na server zotavení po havárii .
Provedení převzetí služeb při selhání do lokality zotavení po havárii
Spusťte příkaz převzetí služeb při selhání v lokalitě zotavení po havárii (azacsnap -c restore --restore revertvolume
).
Důležité
Příkaz azacsnap -c restore --restore revertvolume
přeruší replikaci úložiště z produkční lokality do lokality zotavení po havárii. Abyste mohli znovu nastavit replikaci, musíte se obrátit na operace Microsoftu. Po opětovném povolení replikace se inicializují všechna data v úložišti zotavení po havárii pro tento identifikátor SID. Příkaz, který provede převzetí služeb při selhání, zpřístupní naposledy replikovaný snímek úložiště. Pokud potřebujete provést obnovení zpět na starší snímek, otevřete žádost o podporu, aby operace mohly pomoct poskytnout dřívější snímek obnovený v lokalitě zotavení po havárii.
Na vysoké úrovni najdete postup pro převzetí služeb při selhání zotavení po havárii:
- Je nutné vypnout instanci HANA v primární lokalitě. Tato akce je nutná pouze v případě, že skutečně provádíte převzetí služeb při selhání do lokality zotavení po havárii, takže nemáte data nekonzistence.
- Vypněte instanci HANA na uzlu zotavení po havárii pro produkční identifikátor SID.
- Spusťte příkaz
azacsnap -c restore --restore revertvolume
na uzlu zotavení po havárii s identifikátorem SID, který se má obnovit.- Příkaz přeruší propojení replikace úložiště z primární lokality do lokality zotavení po havárii.
- Příkaz obnoví pouze svazek /data a /logbackups, /shared svazek není obnoven, ale používá existující /shared pro identifikátor SID v umístění zotavení po havárii.
- Připojte svazek /data a /logbackups – nezapomeňte ho přidat do souboru fstab.
- Obnovte snímek HANA SYSTEMDB. V nástroji HANA Studio se zobrazuje jenom nejnovější snímek HANA dostupný v rámci snímku úložiště obnoveného v rámci provádění příkazu
azacsnap -c restore --restore revertvolume
. - Obnovte databázi tenanta.
- Spusťte instanci HANA v lokalitě zotavení po havárii pro produkční identifikátor SID (příklad: H80 v tomto případě).
- Proveďte testování.
Příklad zotavení po havárii
Tato pododdíl popisuje podrobné kroky pro převzetí služeb při selhání do lokality zotavení po havárii.
Krok 1: Získání podrobností o svazku uzlu zotavení po havárii
Spuštěním příkazu df –h
zobrazte seznam systémů souborů a přidružených svazků, na které se po převzetí služeb při selhání odkazuje.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Krok 2: Vypnutí HANA v primární lokalitě
Pokud provádíte úplné převzetí služeb při selhání produkčních úloh a je možné se připojit k primární produkční lokalitě, vypněte instance SAP HANA, u které došlo k převzetí služeb při selhání, k zotavení po havárii.
Pokud se například přihlásíte jako kořen, následující příklad ukazuje, jak se dá SAP HANA vypnout. Nahraďte <sid identifikátorem SID> SAP HANA.
su - <sid>adm
HDB stop
Krok 3: Vypnutí HANA na webu zotavení po havárii
Před obnovením svazků je důležité vypnout SAP HANA na webu zotavení po havárii.
Pokud se například přihlásíte jako kořen, následující příklad ukazuje, jak se dá SAP HANA vypnout. Nahraďte <sid identifikátorem SID> SAP HANA.
su - <sid>adm
HDB stop
Důležité
Před obnovením svazků se ujistěte, že instance HANA na webu zotavení po havárii jsou offline.
Krok 4: Obnovení svazků
azacsnap -c restore --restore revertvolume --dbsid H80
Výstup příkazu převzetí služeb při selhání zotavení po havárii
azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
Production HANA instance in the Disaster Recovery Location either as a
stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.
CAUTION: a failback will be required after running this command and failback
might not be a quick process and will require multiple steps in coordination
with Microsoft Operations.
Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
********************* HANA DR Restore Steps **********************************
* Please complete the following steps to recover your HANA database: *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones. *
* e.g. mkdir /hana/logbackups/H99_SOURCE *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as *
* output above into /etc/fstab of DR Server. *
* 3. Mount newly added filesystems. *
* 4. Perform HANA Snapshot Recovery using HANA Studio. *
********************************************************************************
Poznámka:
Kroky na konci zobrazení konzoly je potřeba provést k dokončení přípravy úložiště na převzetí služeb při selhání zotavení po havárii.
Krok 5: Odpojení nepotřebných systémů souborů
Spuštěním příkazu umount
odpojte systémy souborů nebo svazky, které nejsou potřeba.
umount <Mount point>
Odpojte přípojné body zálohování dat a protokolů. Ve scénáři horizontálního navýšení kapacity můžete mít více přípojných bodů dat.
Krok 6: Konfigurace přípojných bodů
Upravte soubor /etc/fstab
tak, aby zakomentoval položky záloh dat a protokolů pro primární identifikátor SID (V tomto příkladu SID=H80) a přidejte nové položky přípojného bodu vytvořené ze svazků DR primární lokality. Nové položky přípojného bodu jsou k dispozici ve výstupu příkazu.
Zakomentujte stávající přípojné body spuštěné v lokalitě zotavení po havárii pomocí znaku
#
:#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Přidejte následující řádky do
/etc/fstab
to by měl být stejný výstup z příkazu.
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Krok 7: Připojení svazků pro obnovení
Spuštěním příkazu mount –a
připojte všechny přípojné body.
mount -a
Když teď spustíte df –h
, měli byste vidět *_dp
připojené svazky.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Krok 8: Obnovení databáze SYSTEMDB
V nástroji HANA Studio klikněte pravým tlačítkem na instanci SYSTEMDB a zvolte Zálohování a obnovení a pak Obnovit systémovou databázi.
Viz průvodce obnovením databáze ze snímku, konkrétně SYSTEMDB.
Krok 9: Obnovení databáze tenanta
V nástroji HANA Studio klikněte pravým tlačítkem na instanci SYSTEMDB a zvolte Zálohovat a obnovit databázi tenanta.
Prohlédni si průvodce obnovením databáze ze snímku, konkrétně databází TENANTů.
Spuštění azacsnap -c backup
v lokalitě zotavení po havárii
Pokud spouštíte zálohy založené na snímcích v lokalitě zotavení po havárii, měl by být název serveru HANA nakonfigurovaný v azacsnap
konfiguračním souboru v lokalitě zotavení po havárii stejný jako název produkčního serveru.
Důležité
azacsnap -c backup
Spuštěním příkazu can create storage snapshots v lokalitě zotavení po havárii se tyto snímky automaticky nereplikují do jiné lokality. Spolupracujte s operacemi Microsoftu, abyste lépe porozuměli vrácení všech souborů nebo dat zpět do původního produkčního webu.