Acerca dos planos de recuperação
Este artigo fornece uma visão geral dos planos de recuperação no Azure Site Recovery.
Um plano de recuperação reúne computadores em grupos de recuperação com o propósito de uma ativação pós-falha. Um plano de recuperação ajuda a definir um processo de recuperação sistemático, criando pequenas unidades independentes que podem ser objeto de failover. Uma unidade normalmente representa uma aplicação no seu ambiente.
- Um plano de recuperação define como as máquinas fazem failover e a sequência em que elas são iniciadas após o failover.
- Os planos de recuperação podem ser usados para failover e failback do Azure.
- Até 100 instâncias protegidas podem ser adicionadas a um plano de recuperação.
- Você pode personalizar um plano adicionando ordem, instruções e tarefas a ele.
- Depois que um plano é definido, você pode executar um failover nele.
- As máquinas podem ser referenciadas em vários planos de recuperação, nos quais os planos subsequentes ignoram a implantação/inicialização de uma máquina se ela tiver sido implantada anteriormente usando outro plano de recuperação.
Porquê recorrer a um plano de recuperação?
Utilize os planos de recuperação para:
- Modele um aplicativo em torno de suas dependências.
- Automatize as tarefas de recuperação para reduzir o RTO (Recovery Time Objetive, objetivo de tempo de recuperação).
- Verifique se você está preparado para migração ou recuperação de desastres, garantindo que seus aplicativos façam parte de um plano de recuperação.
- Execute failovers de teste em planos de recuperação para garantir que a recuperação de desastres ou a migração estejam funcionando conforme o esperado.
Modelar aplicativos
Você pode planejar e criar um grupo de recuperação para capturar propriedades específicas do aplicativo. Como exemplo, vamos considerar um aplicativo típico de três camadas com um back-end do SQL Server, middleware e um frontend da Web. Normalmente, você personaliza o plano de recuperação para que as máquinas em cada camada iniciem na ordem correta após o failover.
- O back-end SQL deve começar primeiro, o middleware em seguida e, finalmente, o frontend da Web.
- Essa ordem de início garante que o aplicativo esteja funcionando no momento em que a última máquina for iniciada.
- Essa ordem garante que, quando o middleware for iniciado e tentar se conectar à camada do SQL Server, a camada do SQL Server já esteja em execução.
- Essa ordem também ajuda a garantir que o servidor front-end inicie por último, para que os usuários finais não se conectem à URL do aplicativo antes que todos os componentes estejam em execução e o aplicativo esteja pronto para aceitar solicitações.
Para criar essa ordem, adicione grupos ao grupo de recuperação e adicione máquinas aos grupos.
Quando a ordem é especificada, o sequenciamento é usado. As ações são executadas em paralelo, conforme apropriado, para melhorar o RTO de recuperação de aplicativos.
As máquinas de um único grupo fazem failover em paralelo.
Máquinas em grupos diferentes fazem failover em ordem de grupo, de modo que as máquinas do Grupo 2 iniciam seu failover somente depois que todas as máquinas do Grupo 1 tiverem falhado e iniciado.
Com essa personalização em vigor, veja o que acontece quando você executa um failover no plano de recuperação:
- Uma etapa de desligamento tenta desligar as máquinas locais. A exceção é se você executar um failover de teste, caso em que o site primário continua a ser executado.
- O desligamento dispara um failover paralelo de todas as máquinas no plano de recuperação.
- O failover prepara discos de máquina virtual usando dados replicados.
- Os grupos de inicialização são executados em ordem e iniciam as máquinas em cada grupo. Primeiro, o Grupo 1 corre, depois o Grupo 2 e, finalmente, o Grupo 3. Se houver mais de uma máquina em qualquer grupo, todas as máquinas começam em paralelo.
Automatize tarefas em planos de recuperação
Recuperar grandes aplicativos pode ser uma tarefa complexa. As etapas manuais tornam o processo propenso a erros, e a pessoa que executa o failover pode não estar ciente de todas as complexidades do aplicativo. Você pode usar um plano de recuperação para impor ordem e automatizar as ações necessárias em cada etapa, usando runbooks de Automação do Azure para failover para o Azure ou scripts. Para tarefas que não podem ser automatizadas, você pode inserir pausas para ações manuais nos planos de recuperação. Há alguns tipos de tarefas que você pode configurar:
- Tarefas na VM do Azure após o failover: quando você faz failover no Azure, normalmente precisa executar ações para que possa se conectar à VM após o failover. Por exemplo:
- Crie um endereço IP público na VM do Azure.
- Atribua um grupo de segurança de rede ao adaptador de rede da VM do Azure.
- Adicione um balanceador de carga a um conjunto de disponibilidade.
- Tarefas dentro da VM após o failover: essas tarefas normalmente reconfiguram o aplicativo em execução na máquina, para que ele continue a funcionar corretamente no novo ambiente. Por exemplo:
- Modifique a cadeia de conexão do banco de dados dentro da máquina.
- Altere a configuração ou as regras do servidor Web.
Executar um failover de teste em planos de recuperação
Você pode usar um plano de recuperação para acionar um failover de teste. Use as seguintes práticas recomendadas:
Sempre conclua um failover de teste em um aplicativo antes de executar um failover completo. Os failovers de teste ajudam você a verificar se o aplicativo aparece no site de recuperação.
Se você achar que perdeu algo, acione uma limpeza e, em seguida, execute novamente o failover de teste.
Execute um failover de teste várias vezes, até ter certeza de que o aplicativo se recupera sem problemas.
Como cada aplicativo é exclusivo, você precisa criar planos de recuperação personalizados para cada aplicativo e executar um failover de teste em cada um.
Os aplicativos e suas dependências mudam com frequência. Para garantir que os planos de recuperação estejam atualizados, execute um failover de teste para cada aplicativo a cada trimestre.
Ver um vídeo sobre um plano de recuperação
Assista a um vídeo de exemplo rápido mostrando um failover ao clicar para um plano de recuperação para um aplicativo WordPress de duas camadas.