Aspectos sobre la continuidad empresarial y la recuperación ante desastres con Oracle Database@Azure
Este artículo trata en profundidad los aspectos y recomendaciones que se definen en el Área de diseño de la zona de aterrizaje de Azure para la continuidad empresarial y la recuperación ante desastres (BCDR).
El primer paso para crear una arquitectura resistente para su entorno de carga de trabajo es identificar los requisitos de disponibilidad de la solución. Debe determinar el objetivo de tiempo de recuperación (RTO) y el objetivo del punto de recuperación (RPO) según los distintos niveles de error. El RTO define el tiempo de inactividad máximo que una aplicación puede tolerar después de una incidencia. El RPO señala la pérdida máxima de datos que una aplicación puede tolerar debido a un desastre. Después de conocer los requisitos de la solución, puede diseñar la arquitectura para cubrir los requisitos del RTO y del RPO.
Consideraciones de diseño
Ubique Oracle Exadata Database Service en la infraestructura dedicada con Oracle Database@Azure en los centros de datos de Azure y coloque los centros de datos en una zona de disponibilidad de Azure. Las zonas de disponibilidad son específicas de una suscripción. Por ejemplo, la zona de disponibilidad 1 de una suscripción podría no representar el mismo centro de datos físico que la zona de disponibilidad 1 en otra suscripción. Para obtener más información, consulte ¿Qué son las zonas de disponibilidad?
La solución Oracle Database@Azure ofrece tecnologías nativas de Oracle, como Real Application Clusters (RAC) y Data Guard automatizada para altos niveles de disponibilidad y recuperación ante desastres.
La solución incluye una configuración automatizada de Data Guard para la base de datos en espera inicial, también conocida como la primera secundaria. Debe configurar manualmente las réplicas adicionales de Data Guard.
En entornos activo-activos, tiene la opción de usar Oracle GoldenGate para funcionalidades de replicación e integración de datos en tiempo real. Este método garantiza una alta disponibilidad y que los datos sean uniformes en todos los sistemas. Esta herramienta admite una amplia gama de bases de datos y plataformas para que pueda mover y transformar datos sin problemas. Use Oracle GoldenGate para minimizar el tiempo de inactividad durante las migraciones y las actualizaciones, lo que mejora las estrategias de recuperación ante desastres. Oracle GoldenGate no viene incluido en la solución, por lo que puede haber ciertos costes por licencia.
La solución Oracle Database@Azure y sus componentes principales se limitan a la suscripción y región en la que se crea la instancia. El servicio no se implementa en varias zonas y no engloba varias regiones. Para garantizar la resistencia en varias zonas o regiones, puede implementar nuevas instancias para poner como destino zonas de disponibilidad o regiones.
Oracle Database@Azure usa el almacenamiento de objetos de Oracle Cloud Infrastructure (OCI) redundante para integrar copias de seguridad automáticas de bases de datos. Oracle Database Autonomous Recovery Service da protección a las bases de datos de Oracle que se implementan en Exadata.
Recomendaciones de diseño
Tenga en cuenta estos aspectos de BCDR en Oracle Database@Azure.
BCDR en diferentes zonas de disponibilidad
Para garantizar una alta disponibilidad y la protección de recuperación frente a desastres en bases de datos, clústeres de bases de datos o zonas de disponibilidad, use Oracle RAC en Oracle Database@Azure y una base de datos en espera simétrica que se encuentre en otra zona. Esta configuración puede tener resistencia en el centro de datos para los servicios de bases de datos.
Para tener un rendimiento óptimo, coloque los servicios de aplicación que dependen de la base de datos en la misma zona de disponibilidad que la base de datos. Si los servicios de las aplicación están en una suscripción diferente de los servicios de la base de datos, debe aplicar el código adecuado. Utilice la propiedad availabilityZoneMappings
para identificar la zona de disponibilidad física en la que debe colocar los servicios.
Puede configurar Data Guard en modo de máxima disponibilidad con el transporte SYNC o el modo de rendimiento máximo con el transporte ASYNC según los servicios de la aplicación y los requisitos de RPO.
Se recomienda usar el modo de disponibilidad máxima (SYNC) en entornos en los que la integridad de los datos y la no pérdida de estos son los factores más importantes.
Se recomienda usar el modo de rendimiento máximo (ASYNC) en entornos en los que el rendimiento es esencial y el entorno puede tolerar cierta pérdidas de datos.
BCDR en varias regiones
Configure Data Guard en modo de rendimiento máximo para la BCDR regional en función de las funcionalidades de la aplicación y la latencia de red entre regiones. Para obtener más información, consulte Resultados de pruebas de latencia de red de Azure.
La combinación de operaciones de BCDR en diferentes regiones y zonas de disponibilidad se ajustan al nivel Gold de las arquitecturas de referencia de Oracle Maximum Availability Architecture. La arquitectura de nivel Gold ofrece protección frente a los errores integrales en las regiones.
Las recomendaciones sobre BCDR en varias zonas de disponibilidad y regiones se enfocan en la resistencia del servicio Oracle Database@Azure. Para garantizar la resistencia de los servicios de aplicación, puede usar Azure Virtual Machine Scale Sets, Azure Site Recovery, Azure Front Door u otras características o servicios que permitan la disponibilidad de los servicios de aplicaciones en zonas de disponibilidad o regiones.
Se recomienda usar copias de seguridad administradas y almacenar los datos de las copias de seguridad en OCI Object Storage.
Otras consideraciones
Use la infraestructura como código (IaC) para implementar la instancia inicial de Oracle Database@Azure y los clústeres de máquinas virtuales.
Use IaC para implementar bases de datos en OCI. Puede usar IaC para replicar la misma implementación en un sitio de recuperación ante desastres y minimizar el riesgo de error humano.
Aplique las operaciones de conmutación por error y conmutación de estado para garantizar que funcionan en una situación de desastre real. Automatice las operaciones de conmutación por error y conmutación de estado cuando sea posible para minimizar los errores.