Configurare il ripristino di emergenza su larga scala per macchine virtuali VMware/server fisici

Articolo
05/30/2024

Questo articolo descrive come configurare il ripristino di emergenza in Azure per numeri elevati (> 1000) di server fisici o macchine virtuali VMware locali nell'ambiente di produzione usando il servizio Azure Site Recovery.

Definire la strategia BCDR

Nell'ambito della strategia di continuità aziendale e ripristino di emergenza (BCDR), si definiscono gli obiettivi del punto di ripristino (RPO) e gli obiettivi del tempo di ripristino (RTO) per le app e i carichi di lavoro aziendali. RTO misura la durata del tempo e del livello di servizio entro cui un'app o un processo aziendale deve essere ripristinato e disponibile, per evitare problemi di continuità.

Site Recovery offre la replica continua per macchine virtuali VMware e server fisici e un contratto di servizio per RTO.
Quando si pianifica il ripristino di emergenza su larga scala per le macchine virtuali VMware e si individuano le risorse di Azure necessarie, è possibile specificare un valore RTO che verrà usato per i calcoli della capacità.

Procedure consigliate

Alcune procedure consigliate generali per il ripristino di emergenza su larga scala. Queste procedure consigliate sono illustrate in modo più dettagliato nelle sezioni successive del documento.

Identificare i requisiti di destinazione: stimare le esigenze di capacità e risorse in Azure prima di configurare il ripristino di emergenza.
Pianificare i componenti di Site Recovery: individuare i componenti di Site Recovery (server di configurazione, server di elaborazione) necessari per soddisfare la capacità stimata.
Configurare uno o più server di elaborazione con scale-out: non usare il server di elaborazione in esecuzione per impostazione predefinita nel server di configurazione.
Eseguire gli aggiornamenti più recenti: il team di Site Recovery rilascia regolarmente nuove versioni dei componenti di Site Recovery ed è necessario assicurarsi di eseguire le versioni più recenti. A tale scopo, tenere traccia delle novità per gli aggiornamenti e abilitare e installare gli aggiornamenti man mano che vengono rilasciati.
Monitoraggio proattivo: quando si esegue il ripristino di emergenza, è consigliabile monitorare in modo proattivo lo stato e l'integrità dei computer replicati e delle risorse dell'infrastruttura.
Esercitazioni sul ripristino di emergenza: è consigliabile eseguire regolarmente esercitazioni sul ripristino di emergenza. Queste non influiscono sull'ambiente di produzione, ma contribuiscono a garantire che il failover in Azure funzioni come previsto quando necessario.

Raccogliere informazioni sulla pianificazione della capacità

Raccogliere informazioni sull'ambiente locale per valutare e stimare le esigenze di capacità di destinazione (Azure).

Per eseguire questa operazione con VMware, eseguire Deployment Planner per le macchine virtuali VMware.
Per i server fisici, raccogliere le informazioni manualmente.

Eseguire Deployment Planner per macchine virtuali VMware

Deployment Planner consente di raccogliere informazioni sull'ambiente locale VMware.

Eseguire Deployment Planner durante un periodo che rappresenta l'abbandono tipico per le macchine virtuali. In questo modo verranno generate stime e raccomandazioni più accurate.
È consigliabile eseguire Deployment Planner nel computer del server di configurazione, poiché Planner calcola la velocità effettiva dal server in cui è in esecuzione. Altre informazioni sulla misurazione della velocità effettiva.
Se non si dispone ancora di un server di configurazione installato:
- Ottenere una panoramica dei componenti di Site Recovery.
- Definire un server di configurazione su cui eseguire Deployment Planner.

Quindi, eseguire Planner come segue:

Informazioni su Deployment Planner. È possibile scaricare la versione più recente dal portale o scaricarla direttamente.
Esaminare i prerequisiti e gli aggiornamenti più recenti per Deployment Planner e scaricare ed estrarre lo strumento.
Eseguire Deployment Planner nel server di configurazione.
Generare un report per riepilogare le stime e le raccomandazioni.
Analizzare le raccomandazioni del report e le stime dei costi.

Nota

Per impostazione predefinita, lo strumento è configurato per profilare e generare report di un massimo di 1000 macchine virtuali. È possibile modificare questo limite cambiando il valore della chiave MaxVMsSupported nel file ASRDeploymentPlanner.exe.config.

Pianificare capacità e requisiti di destinazione (Azure)

Usando le stime e le raccomandazioni raccolte, è possibile pianificare le risorse di destinazione e la capacità. Se è stato eseguito Deployment Planner per le macchine virtuali VMware, è possibile usare diverse raccomandazioni per il report.

Macchine virtuali compatibili: usare questo numero per identificare il numero di macchine virtuali pronte per il ripristino di emergenza in Azure. Le raccomandazioni sulla larghezza di banda della rete e sui core di Azure si basano su questo numero.
Larghezza di banda della rete necessaria: si noti la larghezza di banda necessaria per la replica differenziale binaria delle macchine virtuali compatibili.
- Quando si esegue il Planner si specifica l'RPO desiderato in pochi minuti. Le raccomandazioni mostrano la larghezza di banda necessaria per soddisfare il valore RPO al 100% e al 90% del tempo.
- Le raccomandazioni sulla larghezza di banda della rete prendono in considerazione la larghezza di banda necessaria per il numero totale di server di configurazione e server di elaborazione consigliati in Planner.
Core di Azure necessari: prendere nota del numero di core necessari nell'area di Azure di destinazione, in base al numero di macchine virtuali compatibili. Se non si dispone di core sufficienti, in caso di failover Site Recovery non sarà in grado di creare le macchine virtuali di Azure necessarie.
Dimensioni batch di macchine virtuali consigliate: le dimensioni batch consigliate si basano sulla possibilità di completare la replica iniziale per il batch entro 72 ore per impostazione predefinita, soddisfacendo un RPO pari al 100%. Il valore orario può essere modificato.

È possibile usare queste raccomandazioni per pianificare le risorse di Azure, la larghezza di banda della rete e la lavorazione in batch di macchine virtuali.

Pianificare sottoscrizioni e quote di Azure

Vogliamo assicurarci che le quote disponibili nella sottoscrizione di destinazione siano sufficienti per gestire il failover.

Attività	Dettagli	Azione
Controllare i core	Se i core nella quota disponibile non sono pari o superiori al conteggio totale della destinazione al momento del failover, i failover avranno esito negativo.	Per le macchine virtuali VMware, verificare di avere un numero sufficiente di core nella sottoscrizione di destinazione per soddisfare la raccomandazione sui core di Deployment Planner. Per i server fisici, verificare che i core di Azure soddisfino le stime manuali. Per controllare le quote, nel portale di Azure in >Sottoscrizione, fare clic su Utilizzo + quote. Altre informazioni sull'aumento delle quote.
Controllare i limiti di failover	Il numero di failover non deve superare i limiti di failover di Site Recovery.	Se i failover superano i limiti, è possibile aggiungere sottoscrizioni ed eseguire il failover a più sottoscrizioni o aumentare la quota per una sottoscrizione.

Limiti di failover

I limiti indicano il numero di failover supportati da Site Recovery entro un'ora, presupponendo tre dischi per computer.

Cosa si intende per conformità? Per avviare una macchina virtuale di Azure, Azure richiede che alcuni driver siano in stato di avvio e servizi come DHCP da impostare per l'avvio automatico.

I computer conformi avranno già queste impostazioni.
Per i computer che eseguono Windows, è possibile controllare in modo proattivo la conformità e renderli conformi, se necessario. Altre informazioni.
I computer Linux vengono conformati solo al momento del failover.

Il computer è conforme ad Azure?	Limiti delle macchine virtuali di Azure (failover del disco gestito)
Sì	2000
No	1000

I limiti presuppongono che altri processi minimi siano in corso nell'area di destinazione per la sottoscrizione.
Alcune aree di Azure sono più piccole e potrebbero avere limiti leggermente inferiori.

Pianificare l'infrastruttura e la connettività delle macchine virtuali

Dopo il failover in Azure, è necessario che i carichi di lavoro funzionino come in locale e consentire agli utenti di accedere ai carichi di lavoro in esecuzione nelle macchine virtuali di Azure.

Altre informazioni sul failover dell'infrastruttura locale di Active Directory o DNS in Azure.
Altre informazioni sulla preparazione della connessione alle macchine virtuali di Azure dopo il failover.

Pianificare i requisiti e la capacità di origine

È importante disporre di server di configurazione e server di elaborazione con scale-out sufficienti per soddisfare i requisiti di capacità. Quando si inizia la distribuzione su larga scala, iniziare con un singolo server di configurazione e un singolo server di elaborazione con scale-out. Quando si raggiungono i limiti previsti, aggiungere altri server.

Nota

Per le macchine virtuali VMware, Deployment Planner fornisce alcune raccomandazioni relative alla ai server di configurazione e di elaborazione necessari. È consigliabile usare le tabelle incluse nelle procedure seguenti, invece di seguire la raccomandazione di Deployment Planner.

Configurare un server di configurazione

La capacità del server di configurazione è influenzata dal numero di computer che eseguono la replica e non dalla varianza dei dati. Per determinare se sono necessari server di configurazione aggiuntivi, usare questi limiti di macchina virtuale definiti.

CPU	Memory	Disco cache	Limite del computer replicato
8 vCPU 2 socket * 4 core a 2,5 Ghz	16 GB	600 GB	Fino a 550 computer Si suppone che ogni computer abbia tre dischi da 100 GB ciascuno.

Questi limiti si basano su un server di configurazione installato usando un modello OVF.
I limiti presuppongono che non si usi il server di elaborazione in esecuzione per impostazione predefinita nel server di configurazione.

Se è necessario aggiungere un nuovo server di configurazione, seguire queste istruzioni:

Configurare un server di configurazione per il ripristino di emergenza di macchine virtuali VMware usando un modello OVF.
Configurare manualmente un server di configurazione per i server fisici o per le distribuzioni VMware che non possono usare un modello OVF.

Durante la configurazione di un server di configurazione, tenere presente che:

Quando si configura un server di configurazione, è importante considerare la sottoscrizione e l'insieme di credenziali all'interno del quale si trova, perché non devono essere modificati dopo l'installazione. Se è necessario modificare l'insieme di credenziali, è necessario annullare l'associazione del server di configurazione dall'insieme di credenziali e registrarlo nuovamente. Questa operazione arresta la replica delle macchine virtuali nell'insieme di credenziali.
Se si vuole configurare un server di configurazione con più schede di rete, è necessario eseguire questa operazione durante la configurazione. Non è possibile eseguire questa operazione dopo la registrazione del server di configurazione nell'insieme di credenziali.

Configurare un server di elaborazione

La capacità del server di elaborazione è influenzata dall'abbandono dei dati e non dal numero di computer abilitati per la replica.

Per le distribuzioni di grandi dimensioni, è consigliabile avere sempre almeno un server di elaborazione con scale-out.
Per determinare se sono necessari server aggiuntivi, usare la tabella seguente.
È consigliabile aggiungere un server con la specifica più elevata.

CPU	Memory	Disco cache	Abbandono
12 vCPU 2 socket *6 core a 2,5 GHz	24 GB	1 TB	Fino a 2 TB al giorno

Configurare il server di elaborazione come segue:

Esaminare i prerequisiti.
Installare il server nel portale o dalla riga di comando.
Configurare i computer replicati per l'uso del nuovo server. Se sono già presenti computer di replica:
- È possibile spostare un intero carico di lavoro del server di elaborazione nel nuovo server di elaborazione.
- In alternativa, è possibile spostare macchine virtuali specifiche nel nuovo server di elaborazione.

Abilitare la replica su larga scala

Dopo aver pianificato la capacità e distribuito i componenti e l'infrastruttura necessari, abilitare la replica per un numero elevato di macchine virtuali.

Ordinare i computer in batch. Viene abilitata la replica per le macchine virtuali all'interno di un batch e quindi si passa al batch successivo.
- Per le macchine virtuali VMware, è possibile usare le dimensioni del batch di macchine virtuali consigliate nel di report Deployment Planner.
- Per i computer fisici, è consigliabile identificare i batch basati su computer con dimensioni e quantità di dati simili e sulla velocità effettiva di rete disponibile. L'obiettivo è quello di raggruppare i computer che probabilmente completano la replica iniziale nella stessa quantità di tempo circa.
Se l'abbandono del disco per un computer è elevato o supera i limiti in Deployment Planner, è possibile spostare file non critici che non è necessario replicare (ad esempio dump di log o file temporanei) dal computer. Per le macchine virtuali VMware, è possibile spostare questi file in un disco separato e quindi escludere tale disco dalla replica.
Prima di abilitare la replica, verificare che i computer soddisfino i requisiti di replica.
Configurare criteri di replica per macchine virtuali VMware o serverfisici.
Abilitare la replica per macchine virtuali VMware o server fisici. Verrà avviata la replica iniziale per i computer selezionati.

Monitorare la distribuzione

Dopo aver avviato la replica per il primo batch di macchine virtuali, avviare il monitoraggio della distribuzione come indicato di seguito:

Assegnare un amministratore del ripristino di emergenza per monitorare lo stato di integrità dei computer replicati.
Monitorare gli eventi per gli elementi replicati e l'infrastruttura.
Monitorare l'integrità dei server di elaborazione con scale-out.
Per semplificare il monitoraggio, iscriversi per ricevere notifiche tramite e-mail per gli eventi.
Eseguire esercitazioni regolari sul ripristino di emergenza per assicurarsi che tutto funzioni come previsto.

Pianificare failover su larga scala

In caso di emergenza, potrebbe essere necessario eseguire il failover di un numero elevato di computer/carichi di lavoro in Azure. Preparare questo tipo di evento come indicato di seguito.

È possibile prepararsi in anticipo per il failover come indicato di seguito:

Preparare l'infrastruttura e le macchine virtuali in modo che i carichi di lavoro siano disponibili dopo il failover e in modo che gli utenti possano accedere alle macchine virtuali di Azure.
Si notino i limiti di failover descritti in precedenza in questo documento. Assicurarsi che i failover rientrino in questi limiti.
Eseguire esercitazioni periodiche sul ripristino di emergenza. Le esercitazioni consentono di:
- Individuare le lacune nella distribuzione prima del failover.
- Stimare l'RTO end-to-end per le app.
- Stimare l'RPO end-to-end per i carichi di lavoro.
- Identificare i conflitti tra intervalli di indirizzi IP.
- Durante l'esecuzione delle esercitazioni, è consigliabile non usare le reti di produzione per le esercitazioni e azzerare i failover di test dopo ogni esercitazione.

Per eseguire un failover su larga scala, è consigliabile:

Creare piani di ripristino per il failover del carico di lavoro.
- Ogni piano di ripristino può attivare il failover di un massimo di 100 computer.
- Ulteriori informazioni sui piani di ripristino.
Aggiungere script del runbook di Automazione di Azure ai piani di ripristino per automatizzare tutte le attività manuali in Azure. Le attività tipiche includono la configurazione di servizi di bilanciamento del carico, l'aggiornamento di DNS e così via. Ulteriori informazioni
Prima del failover, preparare i computer Windows in modo che siano conformi all'ambiente Azure. I limiti di failover sono superiori per i computer conformi. Altre informazioni sui runbook.
Attivare il failover con il cmdlet di PowerShell Start-AzRecoveryServicesAsrPlannedFailoverJob, insieme a un piano di ripristino.

Passaggi successivi

Monitorare Site Recovery

Condividi tramite