Zotavení po havárii pomocí nástroje Aplikace Azure lication Consistent Snapshot

Tento článek vysvětluje, jak provést zotavení po havárii při použití nástroje Aplikace Azure lication Consistent Snapshot, který můžete použít se službou Azure NetApp Files.

Důležité

Tato operace se vztahuje pouze na velkou instanci Azure.

Úvod

Platforma Azure Large Instance může mít také nakonfigurovanou lokalitu zotavení po havárii, do které je možné replikovat snímky svazků úložiště. Pokud byly snímky s takovou instalací správně nakonfigurované, je možné provést zotavení po havárii v této lokalitě. Tento dokument je určený jako průvodce provedením zotavení po havárii pro toto nastavení.

Předpoklady pro nastavení zotavení po havárii

Před plánováním převzetí služeb při selhání zotavení po havárii je nutné splnit následující požadavky.

  • V lokalitě zotavení po havárii máte zřízený uzel zotavení po havárii. Existují dvě možnosti zotavení po havárii. Jeden je normální DR a druhý je multipurpose DR.
  • Replikace úložiště funguje. Provozní tým Microsoftu provádí nastavení replikace úložiště v době automatického zřizování zotavení po havárii. Replikaci úložiště můžete monitorovat pomocí příkazu azacsnap -c details --details replication v lokalitě zotavení po havárii.
  • Nastavili a nakonfigurovali jste snímky úložiště v primárním umístění.
  • Máte v lokalitě zotavení po havárii nainstalovanou instanci HANA pro primární server se stejným identifikátorem SID jako primární instance.
  • Čtete a rozumíte postupu převzetí služeb při selhání zotavení po havárii popsanému ve velkých instancích SAP HANA s vysokou dostupností a zotavením po havárii v Azure.
  • V umístění zotavení po havárii jste nastavili a nakonfigurovali snímky úložiště.
  • Konfigurační soubor (například DR.json) byl vytvořen se svazky úložiště zotavení po havárii a přidruženými informacemi na serveru zotavení po havárii.
  • Dokončili jste kroky v lokalitě zotavení po havárii a provedli jste následující kroky:
    • Povolte komunikaci s úložištěm.
    • Povolte komunikaci se SAP HANA.

Nastavení zotavení po havárii

Microsoft podporuje replikaci na úrovni úložiště pro zotavení po havárii. Existují dva způsoby, jak nastavit zotavení po havárii.

Jeden je normální a druhý je multipurpose. V normálním stavu zotavení po havárii máte vyhrazenou instanci v umístění zotavení po havárii pro převzetí služeb při selhání. Ve scénáři zotavení po havárii s více účely máte v lokalitě zotavení po havárii spuštěnou jinou instanci HANA pro kontrolu kvality nebo vývojovou instanci HANA. Zároveň jste ale nainstalovali předinstalovanou instanci HANA, která je neaktivní a má stejný identifikátor SID jako instance HANA, kterou chcete převzít při selhání do této jednotky velké instance HANA. Operace Microsoftu nastaví prostředí pro vás, včetně replikace úložiště na základě vstupu poskytnutého ve formuláři žádosti o služby (SRF) v době registrace.

Důležité

Ujistěte se, že jsou splněny všechny požadavky pro instalaci zotavení po havárii.

Monitorování replikace dat z primární lokality do lokality zotavení po havárii

Provozní tým Microsoftu už spravuje a monitoruje propojení zotavení po havárii z primární lokality do lokality zotavení po havárii. Pomocí příkazu azacsnap -c details --details replicationsnapshot můžete monitorovat replikaci dat z primárního serveru na server zotavení po havárii .

Provedení převzetí služeb při selhání do lokality zotavení po havárii

Spusťte příkaz převzetí služeb při selhání v lokalitě zotavení po havárii (azacsnap -c restore --restore revertvolume).

Důležité

Příkaz azacsnap -c restore --restore revertvolume přeruší replikaci úložiště z produkční lokality do lokality zotavení po havárii. Abyste mohli znovu nastavit replikaci, musíte se obrátit na operace Microsoftu. Po opětovném povolení replikace se inicializují všechna data v úložišti zotavení po havárii pro tento identifikátor SID. Příkaz, který provede převzetí služeb při selhání, zpřístupní naposledy replikovaný snímek úložiště. Pokud potřebujete provést obnovení zpět na starší snímek, otevřete žádost o podporu, aby operace mohly pomoct poskytnout dřívější snímek obnovený v lokalitě zotavení po havárii.

Na vysoké úrovni najdete postup pro převzetí služeb při selhání zotavení po havárii:

  • Je nutné vypnout instanci HANA v primární lokalitě. Tato akce je nutná pouze v případě, že skutečně provádíte převzetí služeb při selhání do lokality zotavení po havárii, takže nemáte data nekonzistence.
  • Vypněte instanci HANA na uzlu zotavení po havárii pro produkční identifikátor SID.
  • Spusťte příkaz azacsnap -c restore --restore revertvolume na uzlu zotavení po havárii s identifikátorem SID, který se má obnovit.
    • Příkaz přeruší propojení replikace úložiště z primární lokality do lokality zotavení po havárii.
    • Příkaz obnoví pouze svazek /data a /logbackups, /shared svazek není obnoven, ale používá existující /shared pro identifikátor SID v umístění zotavení po havárii.
    • Připojte svazek /data a /logbackups – nezapomeňte ho přidat do souboru fstab.
  • Obnovte snímek HANA SYSTEMDB. V nástroji HANA Studio se zobrazuje jenom nejnovější snímek HANA dostupný v rámci snímku úložiště obnoveného v rámci provádění příkazu azacsnap -c restore --restore revertvolume .
  • Obnovte databázi tenanta.
  • Spusťte instanci HANA v lokalitě zotavení po havárii pro produkční identifikátor SID (příklad: H80 v tomto případě).
  • Proveďte testování.

Příklad zotavení po havárii

Tato pododdíl popisuje podrobné kroky pro převzetí služeb při selhání do lokality zotavení po havárii.

Krok 1: Získání podrobností o svazku uzlu zotavení po havárii

Spuštěním příkazu df –h zobrazte seznam systémů souborů a přidružených svazků, na které se po převzetí služeb při selhání odkazuje.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Krok 2: Vypnutí HANA v primární lokalitě

Pokud provádíte úplné převzetí služeb při selhání produkčních úloh a je možné se připojit k primární produkční lokalitě, vypněte instance SAP HANA, u které došlo k převzetí služeb při selhání, k zotavení po havárii.

Pokud se například přihlásíte jako kořen, následující příklad ukazuje, jak se dá SAP HANA vypnout. Nahraďte <sid identifikátorem SID> SAP HANA.

su - <sid>adm
HDB stop

Krok 3: Vypnutí HANA na webu zotavení po havárii

Před obnovením svazků je důležité vypnout SAP HANA na webu zotavení po havárii.

Pokud se například přihlásíte jako kořen, následující příklad ukazuje, jak se dá SAP HANA vypnout. Nahraďte <sid identifikátorem SID> SAP HANA.

su - <sid>adm
HDB stop

Důležité

Před obnovením svazků se ujistěte, že instance HANA na webu zotavení po havárii jsou offline.

Krok 4: Obnovení svazků

azacsnap -c restore --restore revertvolume --dbsid H80

Výstup příkazu převzetí služeb při selhání zotavení po havárii

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Poznámka:

Kroky na konci zobrazení konzoly je potřeba provést k dokončení přípravy úložiště na převzetí služeb při selhání zotavení po havárii.

Krok 5: Odpojení nepotřebných systémů souborů

Spuštěním příkazu umount odpojte systémy souborů nebo svazky, které nejsou potřeba.

umount <Mount point>

Odpojte přípojné body zálohování dat a protokolů. Ve scénáři horizontálního navýšení kapacity můžete mít více přípojných bodů dat.

Krok 6: Konfigurace přípojných bodů

Upravte soubor /etc/fstab tak, aby zakomentoval položky záloh dat a protokolů pro primární identifikátor SID (V tomto příkladu SID=H80) a přidejte nové položky přípojného bodu vytvořené ze svazků DR primární lokality. Nové položky přípojného bodu jsou k dispozici ve výstupu příkazu.

  • Zakomentujte stávající přípojné body spuštěné v lokalitě zotavení po havárii pomocí znaku # :

    #172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    
  • Přidejte následující řádky do /etc/fstab

    to by měl být stejný výstup z příkazu.

    10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    

Krok 7: Připojení svazků pro obnovení

Spuštěním příkazu mount –a připojte všechny přípojné body.

mount -a

Když teď spustíte df –h , měli byste vidět *_dp připojené svazky.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Krok 8: Obnovení databáze SYSTEMDB

V nástroji HANA Studio klikněte pravým tlačítkem na instanci SYSTEMDB a zvolte Zálohování a obnovení a pak Obnovit systémovou databázi.

Viz průvodce obnovením databáze ze snímku, konkrétně SYSTEMDB.

Krok 9: Obnovení databáze tenanta

V nástroji HANA Studio klikněte pravým tlačítkem na instanci SYSTEMDB a zvolte Zálohovat a obnovit databázi tenanta.

Prohlédni si průvodce obnovením databáze ze snímku, konkrétně databází TENANTů.

Spuštění azacsnap -c backup v lokalitě zotavení po havárii

Pokud spouštíte zálohy založené na snímcích v lokalitě zotavení po havárii, měl by být název serveru HANA nakonfigurovaný v azacsnap konfiguračním souboru v lokalitě zotavení po havárii stejný jako název produkčního serveru.

Důležité

azacsnap -c backup Spuštěním příkazu can create storage snapshots v lokalitě zotavení po havárii se tyto snímky automaticky nereplikují do jiné lokality. Spolupracujte s operacemi Microsoftu, abyste lépe porozuměli vrácení všech souborů nebo dat zpět do původního produkčního webu.

Další kroky