Postupy údržby clusteru s podporou převzetí služeb při selhání

Platí pro: Azure Stack HCI verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019 Windows Server 2016

Tento článek předpokládá, že kvůli provedení údržby musíte fyzický server vypnout nebo ho restartovat z nějakého jiného důvodu. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez přechodu serverů do offline režimu najdete v tématu Aktualizace clusterů Azure Stack HCI.

Offline server kvůli údržbě vyžaduje offline část úložiště, která se sdílí na všech serverech v clusteru s podporou převzetí služeb při selhání. To vyžaduje pozastavení serveru, který chcete převést do režimu offline, uvedení disků serveru do režimu údržby, přesunutí clusterových rolí a virtuálních počítačů na jiné servery v clusteru a ověření, že jsou všechna data dostupná na ostatních serverech v clusteru. Tento proces zajišťuje, že data zůstanou po celou dobu údržby bezpečná a přístupná.

Server můžete převést do offline režimu kvůli údržbě pomocí Windows Admin Center nebo PowerShellu. Toto téma popisuje obě metody.

Převést server do offline režimu pomocí Windows Admin Center

Nejjednodušší způsob, jak se připravit na přechod serveru do offline režimu, je použít Windows Admin Center.

Ověřte, že je bezpečné server převést do offline režimu.

  1. Pomocí Windows Admin Center se připojte k serveru, který chcete převést do režimu offline. V nabídce Nástroje vyberte Disky úložiště > a ověřte, že se ve sloupci Stav pro každý virtuální disk zobrazuje Online.

  2. Pak vyberte Svazky úložiště > a ověřte, že se ve sloupci Stav pro každý svazek zobrazuje V pořádku a že se ve sloupci Stav pro každý svazek zobrazuje OK.

Pozastavení a vyprázdnění serveru

Před vypnutím nebo restartováním serveru byste měli server pozastavit a vyprázdnit (přesunout) všechny clusterované role, jako jsou virtuální počítače, které na něm běží. Clusterované servery vždy pozastavte a vyprázdnte, než je přepnou do režimu offline kvůli údržbě.

  1. Pomocí Windows Admin Center se připojte ke clusteru a pak v nabídce Nástroje ve Správci clusteru vyberte Výpočetní > servery.

  2. Vyberte Inventory(Inventář). Klikněte na název serveru, který chcete pozastavit a vyprázdnit, a vyberte Pozastavit. Měla by se zobrazit následující výzva:

    Pozastavit servery kvůli údržbě: Opravdu chcete pozastavit servery? Tím se úlohy, jako jsou virtuální počítače, přesunou na jiné servery v clusteru.

  3. Pokud chcete server pozastavit a zahájit proces vyprazdňování, vyberte Ano . Stav serveru se zobrazí jako V údržbě, vyprázdnění a role, jako je Hyper-V a virtuální počítače, okamžitě zahájí migraci za provozu na jiné servery v clusteru. Může to trvat několik minut. Dokud se neobnoví, není možné na server přidat žádné role. Po dokončení procesu vyprazdňování se stav serveru zobrazí jako Při údržbě, Vyprazdňování dokončeno. Operační systém provádí automatickou bezpečnostní kontrolu, aby se zajistilo, že je bezpečné pokračovat. Pokud nějaké svazky nejsou v pořádku, zastaví se a upozorní vás, že není bezpečné pokračovat.

Vypnutí serveru

Jakmile se server vyprázdní, můžete ho bezpečně vypnout kvůli údržbě nebo ho restartovat.

Upozornění

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před vypnutím serveru uvést disky do režimu údržby a před obnovením serveru do clusteru je vyvést z režimu údržby.

Obnovení serveru

Až budete připraveni, aby server znovu začal hostovat clusterové role a virtuální počítače, jednoduše server zapněte, počkejte, až se spustí, a obnovte server pomocí následujících kroků.

  1. Ve Správci clusteru vyberte v nabídce Nástroje na levé straně možnost Výpočetní > servery.

  2. Vyberte Inventory(Inventář). Klikněte na název serveru, který chcete obnovit, a potom klikněte na Pokračovat.

Clusterované role a virtuální počítače okamžitě zahájí migraci za provozu zpět na server. Může to trvat několik minut.

Čekání na opětovnou synchronizaci úložiště

Když se server obnoví, musí se všechny nové zápisy, ke kterým došlo v době, kdy byl nedostupný, znovu synchronizovat. K tomu dochází automaticky pomocí inteligentního sledování změn. Není nutné, aby se kontrolovala nebo synchronizovala všechna data. pouze změny. Tento proces se omezuje, aby se zmírnil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastavený a kolik nových dat bylo zapsáno, může dokončení trvat mnoho minut.

Důležité

Před převodem všech ostatních serverů v clusteru do režimu offline musíte počkat na dokončení opětovné synchronizace.

Pokud chcete zkontrolovat, jestli se dokončila opětovná synchronizace úložiště:

  1. Připojte se ke clusteru pomocí Windows Admin Center a vyberte Svazky úložiště>.
  2. Vyberte Inventory(Inventář).
  3. Zkontrolujte sloupec Stav u každého svazku. Pokud se zobrazí OK, opětovná synchronizace úložiště je dokončená. Teď je bezpečné převést ostatní servery v clusteru do režimu offline.

Offline přepíná server pomocí PowerShellu

Pomocí následujících postupů můžete správně pozastavit, vyprázdnit a obnovit server v clusteru s podporou převzetí služeb při selhání pomocí PowerShellu.

Ověřte, že je bezpečné server převést do offline režimu.

Pokud chcete ověřit, že jsou všechny svazky v pořádku, spusťte jako správce následující rutinu:

Get-VirtualDisk

Tady je příklad toho, jak by výstup mohl vypadat:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Ověřte, že vlastnost HealthStatus pro každý svazek je V pořádku a OperationalStatus se zobrazuje OK.

Pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, přejděte na Disky úložiště>.

Pozastavení a vyprázdnění serveru

Spuštěním následující rutiny jako správce server pozastavte a vyprázdněte:

Suspend-ClusterNode -Drain

Pokud to chcete provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na Uzly, klikněte pravým tlačítkem na uzel a pak vyberte Pozastavit>vyprázdnění rolí.

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, pozastavení a vyprázdnění serveru také přepne do režimu údržby disky serveru. Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).

Přepněte disky do režimu údržby

Uvedení disků serveru do režimu údržby v Azure Stack HCI verze 20H2, Windows Serveru 2019 a Windows Server 2016 dává Prostory úložiště s přímým přístupem příležitost řádně vyprázdnit a potvrdit data, aby vypnutí serveru nemělo vliv na stav aplikace. Jakmile disk přejde do režimu údržby, přestane umožňovat zápisy. Pokud chcete minimalizovat časy opětovné synchronizace úložiště, doporučujeme uvést disky do režimu údržby těsně před restartováním a po obnovení systému je z režimu údržby vyřadit.

Poznámka

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se automaticky přepnou do režimu údržby, když je server pozastavený a vyprázdněný. Tyto operační systémy mají funkci podrobných oprav, díky kterým je opětovná synchronizace rychlejší a má menší dopad na systémové a síťové prostředky, takže je možné provádět údržbu serveru a úložiště společně.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Vypnutí serveru

Po dokončení vyprázdnění serveru se v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání zobrazí stav Pozastaveno .

Server teď můžete bezpečně vypnout nebo restartovat pomocí rutin PowerShellu Stop-Computer nebo Restart-Computer pomocí Správce clusteru s podporou převzetí služeb při selhání.

Poznámka

Při spuštění Get-VirtualDisk příkazu na serverech, které vypínají nebo spouští nebo zastavují clusterovou službu, může být provozní stav serveru hlášen jako neúplný nebo snížený a ve sloupci Stav se může zobrazit upozornění. To je normální a nemělo by to způsobovat obavy. Všechny vaše svazky zůstanou online a přístupné.

Ukončení režimu údržby disků

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před obnovením serveru do clusteru zakázat režim údržby úložiště na discích. Pokud chcete minimalizovat časy opětovné synchronizace úložiště, doporučujeme, abyste je ihned po zálohování systému přenesli z režimu údržby.

Poznámka

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se po obnovení serveru automaticky vydají z režimu údržby.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu a zakažte režim údržby úložiště:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Obnovení serveru

Obnovte server v clusteru. Pokud chcete vrátit clusterové role a virtuální počítače, které byly dříve spuštěné na serveru, použijte volitelný příznak -Failback :

Resume-ClusterNode –Failback Immediate

Pokud to chcete udělat ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na Uzly, klikněte pravým tlačítkem na uzel a pak vyberte Obnovit>navrácení rolí po obnovení.

Po obnovení se server v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání zobrazí jako v provozu .

Čekání na opětovnou synchronizaci úložiště

Po obnovení serveru musíte počkat na dokončení opětovné synchronizace a teprve potom převést všechny ostatní servery v clusteru do režimu offline.

Spuštěním následující rutiny jako správce monitorujte průběh:

Get-StorageJob

Pokud už byla opětovná synchronizace dokončena, nezobrazí se žádný výstup.

Tady je příklad výstupu, který ukazuje, že úlohy opětovné synchronizace (opravy) jsou stále spuštěné:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Sloupec BytesTotal ukazuje, kolik úložiště je potřeba znovu synchronizovat. Sloupec PercentComplete zobrazuje průběh.

Upozornění

Není bezpečné převést jiný server do režimu offline, dokud se tyto úlohy opravy nedokončí.

Během této doby se v části HealthStatus budou vaše svazky dál zobrazovat jako Upozornění, což je normální.

Pokud například použijete rutinu Get-VirtualDisk při opětovné synchronizaci úložiště, může se zobrazit následující výstup:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po dokončení úloh pomocí Get-VirtualDisk rutiny ověřte, že svazky znovu zobrazují stav V pořádku. Tady je příklad výstupu:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teď je bezpečné pozastavit a restartovat ostatní servery v clusteru.

Další kroky

Související informace najdete také v tématu: