Effectuer un exercice de reprise d’activité

Effectué

Dans cette unité, vous allez découvrir les exercices de récupération d’urgence avec Site Recovery : ce dont vous devez tenir compte et comment exécuter un test pour vérifier que la configuration est correcte.

Vous pouvez utiliser des exercices de reprise d’activité pour tester la capacité de votre organisation à récupérer à la suite d’une panne, sans impact sur les services de production.

Dans l’exercice précédent, vous avez configuré Azure Site Recovery et vous devez à présent tester la réplication de votre infrastructure. Testez votre configuration en exécutant un exercice de récupération d’urgence. Azure Site Recovery vous permet d’effectuer ces exercices de façon sûre, sans impact sur votre environnement de production. Vous exécuterez également des tests d’assurance qualité sur la configuration pour garantir le bon fonctionnement de votre solution de reprise d’activité.

Qu’est-ce qu’un exercice de reprise d’activité ?

Un exercice de récupération d’urgence est un moyen de vérifier si vous avez correctement configuré votre solution. L’exercice devrait vous donner la certitude que vos données et services sont disponibles même en cas de sinistre. En général, les organisations définissent un objectif de délai de récupération (RTO, Recovery Time Objective) qui indique le temps nécessaire à la récupération de l’infrastructure. Votre entreprise doit également définir un objectif de point de récupération (RPO, Recovery Point Objective), qui définit la quantité de données perdues acceptable en fonction du temps. Par exemple, si le RPO de votre entreprise est d’une journée, vous devez créer une sauvegarde de toutes vos données chaque jour. Vous devez aussi vérifier qu’il faut moins d’une journée pour restaurer cette sauvegarde.

A screenshot that shows the breakdown of failover tests that have been run.

Pour vérifier que nous exécutons nos tests de récupération d’urgence, Site Recovery nous invite activement à les exécuter dans le tableau de bord Site Recovery.

Pourquoi devez-vous effectuer un exercice de reprise d’activité ?

Un exercice de reprise d’activité est essentiel pour garantir que la solution implémentée répond aux exigences de continuité d’activité et de reprise d’activité (BCDR) ainsi que pour vérifier que la réplication fonctionne correctement. Votre exercice de récupération d'urgence, combiné avec les objectifs de délai et de point de récupération, doit être testé minutieusement pour garantir que la réplication, le basculement et la récupération s’effectuent dans le délai imparti.

Par exemple, supposons que votre RTO est d’une heure et que le RPO est de six heures. Si vos systèmes sont sauvegardés toutes les heures, cela signifie une heure de pertes de données, plus l’heure supplémentaire pour la récupération des systèmes.

Imaginons que votre délai de récupération réel soit de cinq heures. Vos systèmes sont sur le point de dater de plus de six heures, ce qui signifie que vous ne respecterez pas l’objectif de point de récupération du plan de continuité de l’activité et reprise d’activité. Le test de la durée réelle de la récupération après des défaillances peut vous assurer que les systèmes respectent les plans de continuité de l’activité et reprise d’activité.

Test de basculement de machines individuelles

Un test de basculement vous permet de simuler un incident et de voir ses effets. Vous pouvez démarrer un test de basculement depuis le tableau de bord Site Recovery ou directement à partir du menu de récupération d'urgence sur une machine virtuelle spécifique. Commencez par choisir un point de récupération. Vous pouvez choisir l’un des derniers points traités, le dernier point de cohérence des applications ou un point de récupération personnalisé.

Créer un test de basculement

Créez un réseau virtuel isolé pour que votre infrastructure de production ne soit pas affectée. Pour ce faire, procédez comme suit :

  1. Ouvrez la machine virtuelle cible nommée patients-records. Pour la trouver facilement, filtrez toutes les ressources afin d’afficher uniquement Type == Virtual machine. Sélectionnez patient-records dans la liste des résultats.

  2. Dans le menu des ressources, faites défiler jusqu’à Opérations, puis sélectionnez Reprise d’activité.

    Screenshot that shows the Operations' disaster recovery option for a selected VM.

  3. Un nouveau volet Éléments répliqués s’affiche. Sélectionnez Actualiser jusqu’à ce que l’option Protégé apparaisse dans le champ d’état. Puis, dans la barre de menus supérieure, sélectionnez Tester le basculement.

    Screenshot that shows the test failover button for a selected VM.

  4. Une fois la validation réussie, sélectionnez votre réseau virtuel dans la liste déroulante Réseau virtuel Azure, puis sélectionnez le bouton Test de basculement. Cette option exécute un test de basculement de la machine virtuelle et vous permet de suivre sa progression dans la page des travaux Site Recovery en sélectionnant l’icône Notifications et le lien Démarrage de la tâche pour effectuer le test de basculement de la machine virtuelle.

  5. Une fois l’opération terminée, la machine virtuelle basculée apparaît dans le portail sous Machines virtuelles, dans la région de récupération. Vous pouvez ensuite vérifier que la machine virtuelle est en cours d’exécution, qu’elle est dimensionnée et connectée correctement, et qu’elle met en miroir la machine virtuelle source, mais dans une autre région Azure.

  6. Une fois que vous avez validé que tout a fonctionné comme prévu, vous pouvez supprimer la machine virtuelle répliquée en sélectionnant Nettoyer le test de basculement dans le volet Récupération d'urgence. À ce stade, nous vous recommandons d’ajouter des notes sur le résultat du test. Cochez la case en regard de Le test est terminé pour supprimer la machine virtuelle de test de basculement, puis sélectionnez OK.

Basculement flexible de plusieurs ordinateurs

Site Recovery vous donne la possibilité d’exécuter un scénario de test de récupération d’urgence complet pour toutes vos machines virtuelles. Vous pouvez créer des plans de récupération qui incluent une ou plusieurs des machines virtuelles. Les basculements sont exécutables autant de fois que nécessaire et offrent une stratégie flexible pour tester différentes combinaisons d’infrastructure.

Screenshot that shows a test failover dashboard used to track the failover job execution.

Tout comme pour les tests des machines virtuelles individuelles, le même nettoyage de test est disponible pour tout ce qui est inclus dans le plan de récupération.

Screenshot that shows the option to clean up a test failover.

Différence entre un exercice et un basculement de production

L’exécution d’un basculement de production dans Site Recovery est semblable à celle d’un exercice de test. Il existe quelques différences, la première étant la sélection de Basculement au lieu de Test de basculement. Vous pouvez choisir d’arrêter la machine virtuelle source avant de commencer le basculement afin qu’aucune donnée ne soit perdue pendant le basculement. Site Recovery ne nettoie pas l’environnement source une fois le basculement terminé.

Quand le basculement est terminé, vérifiez que la machine virtuelle fonctionne comme prévu. Site Recovery vous permet de changer le point de récupération à ce stade. Si vous êtes satisfait du fonctionnement du basculement, vous pourrez valider le basculement. Site Recovery supprime tous les points de récupération de la machine virtuelle source et termine le basculement. Avec l’infrastructure et les données répliquées dans la région secondaire, vous devez garder à l’esprit que la nouvelle machine virtuelle dans la région secondaire a également besoin d’une protection.

Vérifiez vos connaissances

1.

Comment Site Recovery prend-il en charge le regroupement des ordinateurs et des charges de travail ?