Ripristinare un server in Azure Stack HCI versione 23H2

Articolo
07/16/2024

Si applica a: Azure Stack HCI, versione 23H2

Questo articolo descrive come ripristinare un server nel cluster Azure Stack HCI.

Informazioni sui server di ripristino

Azure Stack HCI è un sistema iperconvergente che consente di ripristinare i server da cluster esistenti. Potrebbe essere necessario ripristinare un server in un cluster in caso di errore hardware.

Prima di ripristinare un server, assicurarsi di rivolgersi al provider di soluzioni, quali componenti nel server sono unità di sostituzione dei campi (FRU) che è possibile sostituire manualmente e quali componenti richiederebbero che un tecnico sostituisca.

Le parti che supportano lo scambio ad accesso frequente in genere non richiedono la ricreazione dell'immagine del server a differenza dei componenti non scambiabili a caldo, ad esempio la scheda madre. Consultare il produttore dell'hardware per determinare quali sostituzioni dei componenti richiederebbero la ricreazione dell'immagine del server. Per altre informazioni, vedere Sostituzione dei componenti.

Ripristinare il flusso di lavoro del server

Il diagramma di flusso seguente illustra il processo complessivo per ripristinare un server.

*Il server potrebbe non trovarsi in uno stato in cui l'arresto è possibile o necessario

Per ripristinare un server esistente, seguire questa procedura generale:

Se possibile, arrestare il server che si desidera ripristinare. A seconda dello stato del server, un arresto potrebbe non essere possibile o necessario.
Ricreazione dell'immagine del server che deve essere ripristinato.
Eseguire l'operazione di ripristino del server. Il sistema operativo, i driver e il firmware di Azure Stack HCI vengono aggiornati come parte dell'operazione di ripristino.

Lo spazio di archiviazione viene ribilanciato automaticamente nel server ricreato. Il ribilanciamento dell'archiviazione è un'attività con priorità bassa che può essere eseguita per più giorni a seconda del numero di server e dell'archiviazione usata.

Scenari supportati

Il ripristino di un server ricrea l'immagine di un server e lo riporta al cluster con il nome e la configurazione precedenti.

Il ripristino di un singolo server comporta una ridistribuzione con l'opzione per rendere persistenti i volumi di dati. Solo il volume di sistema viene eliminato e appena sottoposto a provisioning durante la distribuzione.

Importante

Assicurarsi di avere sempre backup per i carichi di lavoro e di non basarsi solo sulla resilienza del sistema. Ciò è particolarmente critico negli scenari a server singolo.

Impostazioni di resilienza

In questa versione, per l'operazione di ripristino del server, le attività specifiche non vengono eseguite sui volumi del carico di lavoro creati dopo la distribuzione. Per l'operazione di ripristino del server, vengono ripristinati e visualizzati solo i volumi di infrastruttura necessari e i volumi del carico di lavoro come volumi condivisi cluster.

Gli altri volumi del carico di lavoro creati dopo la distribuzione vengono ancora conservati ed è possibile individuare questi volumi eseguendo Get-VirtuaDisk il cmdlet . Sarà necessario sbloccare manualmente il volume (se il volume è abilitato per BitLocker) e creare un file CSV (se necessario).

Requisiti hardware

Quando si ripristina un server, il sistema convalida l'hardware del nuovo server in ingresso e garantisce che il server soddisfi i requisiti hardware prima che venga aggiunto al cluster.

Componente	Verifica della conformità
CPU	Verificare che il nuovo server abbia lo stesso numero di o più core CPU. Se i core CPU nel nodo in ingresso non soddisfano questo requisito, viene visualizzato un avviso. L'operazione è tuttavia consentita.
Memoria	Verificare che il nuovo server disponga della stessa quantità di memoria installata o superiore. Se la memoria nel nodo in ingresso non soddisfa questo requisito, viene visualizzato un avviso. L'operazione è tuttavia consentita.
Unità	Verificare che il nuovo server disponga dello stesso numero di unità dati disponibili per Spazi di archiviazione diretta. Se il numero di unità nel nodo in ingresso non soddisfa questo requisito, viene segnalato un errore e l'operazione viene bloccata.

Sostituzione del server

È possibile sostituire l'intero server:

Con un nuovo server con un numero di serie diverso rispetto al server precedente.
Con il server corrente dopo averlo ricreato l'immagine.

Durante la sostituzione del server sono supportati gli scenari seguenti:

Server	Disco	Supportata
Nuovo server	Nuovi dischi	Sì
Nuovo server	Dischi correnti	Sì
Server corrente (ricreazione dell'immagine)	I dischi correnti sono stati riformattati *	No
Server corrente (ricreazione dell'immagine)	Nuovi dischi	Sì
Server corrente (ricreazione dell'immagine)	Dischi correnti	Sì

**I dischi usati da Spazi di archiviazione diretta richiedono una pulizia corretta. La riformattazione non è sufficiente. Vedere come pulire le unità.

Importante

Se si sostituisce un componente durante il ripristino del server, non è necessario sostituire o reimpostare le unità dati. Se si sostituisce un'unità o la si reimposta, l'unità non verrà riconosciuta dopo che il server viene aggiunto al cluster.

Sostituzione di componenti

Nel cluster Azure Stack HCI i componenti non scambiabili a caldo includono gli elementi seguenti:

Scheda madre/Controller BMC (Baseboard Management Controller)/Scheda video
Controller disco/scheda bus host (HBA)/backplace
Scheda di rete
Unità di elaborazione grafica
Unità dati (unità che non supportano lo swapping a caldo, ad esempio schede di componenti aggiuntivi PCI-e)

I passaggi di sostituzione effettivi per i componenti non sostituibili a caldo variano in base al fornitore hardware oem (Original Equipment Manufacturer). Vedere la documentazione del fornitore OEM se è necessaria una riparazione del server per i componenti non scambiabili a caldo.

Prerequisiti

Prima di ripristinare un server, è necessario assicurarsi che:

AzureStackLCMUser è attivo in Active Directory. Per altre informazioni, vedere Preparare Active Directory.
Accesso come AzureStackLCMUser o un altro utente con autorizzazioni equivalenti.
Le credenziali per l'oggetto AzureStackLCMUser non sono state modificate.

Se necessario, portare offline il server identificato per il ripristino. Seguire questa procedura:

Ripristinare un server

Questa sezione descrive come ripristinare un server usando PowerShell, monitorare lo stato dell'operazione Repair-Server e risolvere i problemi in caso di problemi.

Assicurarsi di aver esaminato i prerequisiti.

Seguire questa procedura nel server che si sta tentando di ripristinare.

Installare il sistema operativo e i driver necessari. Seguire la procedura descritta in Installare Azure Stack HCI, versione 23H2 Del sistema operativo.

Nota

Se il cluster usa una finalità network ATC dedicata per l'archiviazione e si usano indirizzi IP di archiviazione personalizzati, è necessario configurare gli indirizzi IP nelle schede di rete di archiviazione prima di eseguire l'operazione Repair-Server. Se il cluster usa una finalità ATC di rete condivisa per l'archiviazione e altri tipi di traffico, ad esempio calcolo e gestione, sarà necessario configurare manualmente gli indirizzi IP nelle schede di rete virtuale di archiviazione dopo il ripristino del server.
Registrare il server con Arc. Seguire la procedura descritta in Registrare con Arc e configurare le autorizzazioni.

Nota

Per eseguire la registrazione con Arc, è necessario usare gli stessi parametri dei nodi esistenti. Ad esempio: Nome gruppo di risorse, Area, Sottoscrizione e Tentant.
Assegnare le autorizzazioni seguenti al nodo riparato:
- Ruolo Gestione dispositivi azure Stack HCI
- Utente dei segreti di Key Vault Per altre informazioni, vedere Assegnare autorizzazioni al server.

Seguire questa procedura in un altro server membro dello stesso cluster Azure Stack HCI.

Prima di aggiungere il server, assicurarsi di ottenere un token di autenticazione aggiornato. Esegui questo comando:
```
 Update-AuthenticationToken
```
Accedere al server già membro del cluster, con le credenziali utente di dominio specificate durante la distribuzione del cluster. Eseguire il comando seguente per ripristinare il server in ingresso:
```
$Cred = Get-Credential 
Repair-Server -Name "< Name of the new server>" -LocalAdminCredential $Cred
```
Nota

Il nome del server deve essere il nome NetBIOS.
Prendere nota dell'ID operazione come output dal Repair-Server comando . Questa operazione verrà usata in un secondo momento per monitorare lo stato dell'operazione Repair-Server .

Nota

Se è stato distribuito il cluster Azure Stack HCI usando indirizzi IP di archiviazione personalizzati, è necessario assegnare manualmente gli indirizzi IP alle schede di rete di archiviazione dopo il ripristino del server.

Monitorare lo stato dell'operazione

Per monitorare lo stato di avanzamento dell'operazione di aggiunta del server, seguire questa procedura:

Eseguire il cmdlet seguente e specificare l'ID operazione del passaggio precedente.

$ID = "<Operation ID>" 
Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID

Al termine dell'operazione, il processo di ribilanciamento dello spazio di archiviazione in background continuerà a essere eseguito. Attendere il completamento del processo di ribilanciamento dell'archiviazione. Per verificare lo stato di avanzamento di questo processo di ribilanciamento dell'archiviazione, usare il cmdlet seguente:
```
Get-VirtualDisk|Get-StorageJob
```
Se il processo di ribilanciamento dell'archiviazione è stato completato, il cmdlet non restituirà un output.

Scenari di ripristino

Gli scenari di ripristino seguenti e i passaggi di mitigazione consigliati vengono tabulati per il ripristino di un server:

Descrizione dello scenario	Strategia di riduzione del rischio	Supportata
L'operazione di ripristino del server non è riuscita.	Per completare l'operazione, esaminare l'errore. Rieseguire l'operazione non riuscita usando `Add-Server -Rerun`.	Sì
L'operazione di ripristino del server ha avuto esito positivo parzialmente, ma ha dovuto iniziare con un'installazione aggiornata del sistema operativo.	In questo scenario, l'agente di orchestrazione (noto anche come Lifecycle Manager) ha già aggiornato il proprio archivio conoscenze con il nuovo server. Usare lo scenario del server di ripristino.	Sì

Risoluzione dei problemi

Se si verificano errori o errori durante il ripristino di un server, è possibile acquisire l'output degli errori in un file di log.

Accedere con le credenziali utente di dominio specificate durante la distribuzione del cluster. Acquisire il problema nei file di log.
```
Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
```
Per rieseguire l'operazione non riuscita, usare il cmdlet seguente:
```
Repair-Server -Rerun
```

Passaggi successivi

Altre informazioni su come aggiungere un server.

Condividi tramite