Procedure di manutenzione del cluster di failover

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Questo articolo presuppone che sia necessario spegnere un server fisico per eseguire la manutenzione o riavviarlo per qualche altro motivo. Per installare gli aggiornamenti in un cluster Azure Stack HCI senza portare offline i server, vedere Aggiornare i cluster Azure Stack HCI.

L'uso offline di un server per la manutenzione richiede l'uso offline di parti dell'archiviazione condivise tra tutti i server in un cluster di failover. Ciò richiede la sospensione del server che si vuole portare offline, l'inserimento dei dischi del server in modalità di manutenzione, lo spostamento di ruoli cluster e macchine virtuali (VM) in altri server nel cluster e la verifica che tutti i dati siano disponibili negli altri server del cluster. Questo processo garantisce che i dati rimangano sicuri e accessibili durante il periodo di manutenzione.

È possibile usare Windows Admin Center o PowerShell per portare un server offline per la manutenzione. In questo argomento vengono illustrati entrambi i metodi.

Portare un server offline tramite Windows Admin Center

Il modo più semplice per prepararsi a portare un server offline consiste nell'usare Windows Admin Center.

Verificare che sia sicuro portare il server offline

  1. Usando Windows Admin Center, connettersi al server che si vuole portare offline. Selezionare Dischi di archiviazione > dal menu Strumenti e verificare che la colonna Stato per ogni disco virtuale sia online.

  2. Selezionare quindi Volumi di archiviazione > e verificare che la colonna Integrità per ogni volume mostri Integrità e che la colonna Stato per ogni volume mostri OK.

Sospendere e svuotare il server

Prima di arrestare o riavviare un server, è necessario sospendere il server e svuotare (spostare) tutti i ruoli del cluster, ad esempio le macchine virtuali in esecuzione. Sospendere e svuotare sempre i server cluster prima di portarli offline per la manutenzione.

  1. Usando Windows Admin Center, connettersi al cluster e quindi selezionare > Server di calcolo dal menu Strumenti in Gestione cluster.

  2. Selezionare Inventario. Fare clic sul nome del server che si desidera sospendere e svuotare e selezionare Sospendi. Verrà visualizzato il prompt seguente:

    Sospendere i server per la manutenzione: sospendere i server? In questo modo i carichi di lavoro, ad esempio le macchine virtuali, vengono spostati in altri server del cluster.

  3. Selezionare per sospendere il server e avviare il processo di svuotamento. Lo stato del server verrà visualizzato come In maintenance, Draining e roles such as Hyper-V and V vm will immediatamente begin live migrate to other server/s in the cluster. L'operazione potrebbe richiedere alcuni minuti. Nessun ruolo può essere aggiunto al server finché non viene ripreso. Al termine del processo di svuotamento, lo stato del server verrà visualizzato come In manutenzione, svuotamento completato. Il sistema operativo esegue un controllo di sicurezza automatico per assicurarsi che sia sicuro procedere. Se sono presenti volumi non integri, si arresterà e si avvisa che non è sicuro procedere.

Arrestare il server

Una volta completato lo svuotamento del server, è possibile arrestarlo in modo sicuro per la manutenzione o riavviarlo.

Avviso

Se il server esegue Azure Stack HCI, versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario inserire i dischi in modalità di manutenzione prima di arrestare il server e togliere i dischi dalla modalità di manutenzione prima di riprendere il server nel cluster.

Riprendere il server

Quando si è pronti per avviare nuovamente l'hosting di ruoli e macchine virtuali del cluster, è sufficiente attivare il server, attendere l'avvio e riprendere il server attenendosi alla procedura seguente.

  1. In Gestione cluster selezionare > Server di calcolo dal menu Strumenti a sinistra.

  2. Selezionare Inventario. Fare clic sul nome del server da riprendere e quindi su Riprendi.

I ruoli e le macchine virtuali in cluster inizieranno immediatamente la migrazione in tempo reale al server. L'operazione potrebbe richiedere alcuni minuti.

Attendere la risincronizzazione dell'archiviazione

Quando il server viene ripreso, è necessario risincronizzare eventuali nuove scritture che si sono verificate mentre non erano disponibili. Ciò avviene automaticamente, usando il rilevamento intelligente delle modifiche. Non è necessario che tutti i dati vengano analizzati o sincronizzati; solo le modifiche. Questo processo è limitato per ridurre l'impatto sui carichi di lavoro di produzione. A seconda della durata della sospensione del server e della quantità di nuovi dati scritti, il completamento può richiedere molti minuti.

Importante

Prima di portare offline tutti gli altri server del cluster, è necessario attendere il completamento della sincronizzazione.

Per verificare se la risincronizzazione dell'archiviazione è stata completata:

  1. Connettersi al cluster usando Windows Admin Center e selezionare Volumi di archiviazione>.
  2. Selezionare Inventario.
  3. Controllare la colonna Stato per ogni volume. Se viene visualizzato OK, la risincronizzazione dell'archiviazione è stata completata. È ora possibile portare offline altri server nel cluster.

Portare un server offline con PowerShell

Usare le procedure seguenti per sospendere, svuotare e riprendere correttamente un server in un cluster di failover tramite PowerShell.

Verificare che sia sicuro portare il server offline

Per verificare che tutti i volumi siano integri, eseguire il cmdlet seguente come amministratore:

Get-VirtualDisk

Ecco un esempio dell'aspetto dell'output:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Verificare che la proprietà HealthStatus per ogni volume sia Integro e OperationalStatus mostri OK.

A tale scopo, usare Gestione cluster di failover, passare aDischidi archiviazione>.

Sospendere e svuotare il server

Eseguire il cmdlet seguente come amministratore per sospendere e svuotare il server:

Suspend-ClusterNode -Drain

A tale scopo, in Gestione cluster di failover passare a Nodi, fare clic con il pulsante destro del mouse sul nodo e quindi scegliere Sospendi>ruoli di svuotamento.

Se il server esegue Azure Stack HCI, versione 21H2 o Windows Server 2022, la sospensione e lo svuotamento del server inserisce anche i dischi del server in modalità di manutenzione. Se il server esegue Azure Stack HCI, versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario eseguire questa operazione manualmente (vedere il passaggio successivo).

Inserire i dischi in modalità di manutenzione

In Azure Stack HCI, versione 20H2, Windows Server 2019 e Windows Server 2016, l'inserimento dei dischi del server in modalità di manutenzione offre Spazi di archiviazione diretta l'opportunità di scaricare ed eseguire il commit dei dati per garantire che l'arresto del server non influisca sullo stato dell'applicazione. Non appena un disco passa alla modalità di manutenzione, non consentirà più le scritture. Per ridurre al minimo i tempi di risincronizzazione dello spazio di archiviazione, è consigliabile inserire i dischi in modalità di manutenzione subito prima del riavvio e rimuoverli dalla modalità di manutenzione non appena viene eseguito il backup del sistema.

Nota

Se il server esegue Azure Stack HCI, versione 21H2 o Windows Server 2022, è possibile ignorare questo passaggio perché i dischi vengono automaticamente inseriti in modalità di manutenzione quando il server viene sospeso e svuotato. Questi sistemi operativi hanno una funzionalità di riparazione granulare che rende le risincronizzazioni più veloci e meno interessate sulle risorse di sistema e di rete, rendendo possibile eseguire la manutenzione del server e dell'archiviazione insieme.

Se il server esegue Windows Server 2019 o Azure Stack HCI versione 20H2, eseguire il cmdlet seguente come amministratore:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Se il server esegue Windows Server 2016, usare invece la sintassi seguente:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Arrestare il server

Al termine dello svuotamento del server, verrà visualizzato come Sospeso in PowerShell e Gestione cluster di failover.

È ora possibile arrestare o riavviare il server in modo sicuro usando i Stop-Computer cmdlet di PowerShell o Restart-Computer Gestione cluster di failover.

Nota

Quando si esegue un Get-VirtualDisk comando nei server che arrestano o arrestano o arrestano il servizio cluster, lo stato operativo del server può essere segnalato come incompleto o danneggiato e la colonna Stato integrità potrebbe elencare un avviso. Questo è normale e non dovrebbe causare preoccupazione. Tutti i volumi rimangono online e accessibili.

Disconnesso dalla modalità di manutenzione

Se il server esegue Azure Stack HCI versione 20H2, Windows Server 2019 o Windows Server 2016, è necessario disabilitare la modalità di manutenzione dell'archiviazione sui dischi prima di riprendere il server nel cluster. Per ridurre al minimo i tempi di risincronizzazione dell'archiviazione, è consigliabile rimuoverli dalla modalità di manutenzione non appena viene eseguito il backup del sistema.

Nota

Se il server esegue Azure Stack HCI, versione 21H2 o Windows Server 2022, è possibile ignorare questo passaggio perché i dischi verranno automaticamente rimossi dalla modalità di manutenzione quando il server viene ripreso.

Se il server esegue Windows Server 2019 o Azure Stack HCI versione 20H2, eseguire il cmdlet seguente come amministratore per disabilitare la modalità di manutenzione dell'archiviazione:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Se il server esegue Windows Server 2016, usare invece la sintassi seguente:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Riprendere il server

Riprendere il server nel cluster. Per restituire i ruoli cluster e le macchine virtuali in esecuzione in precedenza nel server, usare il flag facoltativo -Failback :

Resume-ClusterNode –Failback Immediate

A tale scopo, in Gestione cluster di failover passare a Nodi, fare clic con il pulsante destro del mouse sul nodo e quindi scegliere Riprendi ruoli>di failback.

Dopo aver ripreso il server, verrà visualizzato come Up in PowerShell e Gestione cluster di failover.

Attendere la risincronizzazione dell'archiviazione

Quando il server viene ripreso, è necessario attendere il completamento della sincronizzazione prima di portare offline altri server del cluster.

Eseguire il cmdlet seguente come amministratore per monitorare lo stato di avanzamento:

Get-StorageJob

Se la sincronizzazione è già stata completata, non si otterrà alcun output.

Ecco alcuni output di esempio che mostrano processi di ripristino (ripristino) ancora in esecuzione:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

La colonna BytesTotal mostra la quantità di archiviazione necessaria per la risincronizzazione. La colonna PercentComplete visualizza lo stato di avanzamento.

Avviso

Non è sicuro accettare un altro server offline fino al termine di questi processi di ripristino.

Durante questo periodo, in HealthStatus, i volumi continueranno a essere visualizzati come avviso, che è normale.

Ad esempio, se si usa il cmdlet durante la sincronizzazione dell'archiviazione, è possibile visualizzare l'output Get-VirtualDisk seguente:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Al termine dei processi, verificare che i volumi visualizzino di nuovo Integro usando il Get-VirtualDisk cmdlet. Ecco un esempio di output:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

È ora possibile sospendere e riavviare altri server nel cluster.

Passaggi successivi

Per informazioni correlate, vedere anche: