Résilience aux pannes de zone de disponibilité dans Azure Cosmos DB for PostgreSQL

S’APPLIQUE À : Azure Cosmos DB for PostgreSQL (avec l’extension de base de données Citus pour PostgreSQL)

De nombreuses régions Azure ont des zones de disponibilité. Les zones de disponibilité (AZ) sont des groupes de centres de données distincts au sein d’une région. Les zones de disponibilité sont suffisamment proches pour avoir des connexions à faible latence à d’autres zones de disponibilité au sein de leur région. Elles sont connectées par un réseau hautes performances avec une latence aller-retour de moins de 2 millisecondes.

En même temps, les zones de disponibilité sont assez éloignées pour réduire la probabilité que plusieurs d’entre elles soient affectées par des conditions météorologiques ou des pannes locales. Les zones de disponibilité disposent d’une alimentation, d’un système de refroidissement et d’une infrastructure réseau indépendants. Elles sont conçues afin qu’en cas de panne d’une zone, les services régionaux soient pris en charge par les zones restantes entre différents services Azure.

Azure Cosmos DB for PostgreSQL prend en charge les zones de disponibilité afin d’améliorer la fiabilité et la récupération d’urgence. Les avantages des zones de disponibilité varient selon que la haute disponibilité est activée ou non sur un cluster Azure Cosmos DB for PostgreSQL.

Résilience aux pannes de zone de disponibilité pour les composants de service régionaux

Il existe de nombreux composants de service Azure Cosmos DB for PostgreSQL dans chaque région Azure prise en charge qui n’appartiennent pas à des clusters individuels, mais qui sont plutôt des parties critiques de l’exécution du service managé. Ces composants permettent l’exécution continue de toutes les opérations de gestion, telles que le provisionnement de nouveau cluster et la mise à l’échelle des clusters existants, ainsi que de toutes les opérations internes telles que le monitoring de l’intégrité des nœuds.

Lorsque la région Azure prend en charge les zones de disponibilité, tous ces composants de service sont configurés pour être redondants interzone. Cela signifie que tous les composants de service Azure Cosmos DB for PostgreSQL peuvent résister à une panne d’une zone de disponibilité, ou autrement dit qu’ils sont résilients à une panne de zone de disponibilité unique.

Qu’un cluster soit configuré ou non avec une haute disponibilité, ses opérations continues dépendent de ces composants de service. La redondance interzone des composants de service est un élément critique de la résilience aux pannes des zones de disponibilité dans Azure Cosmos DB for PostgreSQL.

Impact des pannes de zone de disponibilité sur les clusters avec et sans haute disponibilité

Tous les nœuds d’un cluster sont provisionnés dans une zone de disponibilité unique. Le paramètre de zone de disponibilité préférée vous permet de placer tous les nœuds de cluster dans la zone de disponibilité où l’application est déployée. Le fait que tous les nœuds soient dans la même zone de disponibilité garantit une latence inférieure entre les nœuds, ce qui améliore les performances globales du cluster.

Lorsque la haute disponibilité (HA) est activée sur un cluster, tous les nœuds principaux sont créés dans une zone de disponibilité et tous les nœuds de secours sont provisionnés dans une autre zone de disponibilité. Les nœuds peuvent se déplacer parmi les zones de disponibilité pendant les événements suivants :

  • Une défaillance se produit sur un nœud principal prenant en charge la haute disponibilité. Dans ce cas, le secours du nœud principal devient le nouveau nœud principal, et la zone de disponibilité du nœud de secours devient la nouvelle zone de disponibilité pour ce nœud principal.
  • Un événement de maintenance planifiée se produit sur le cluster. À la fin de la maintenance, tous les nœuds principaux d’un cluster vont se trouver dans la même zone de disponibilité.

Si la haute disponibilité est activée, le cluster continue d’être disponible tout au long de la panne de zone de disponibilité, avec un basculement possible sur les nœuds principaux qui se trouvent dans la zone de disponibilité impactée. Si la haute disponibilité n’est pas activée sur un cluster, seule une panne dans la zone de disponibilité où les nœuds sont déployés aurait un impact sur la disponibilité du cluster.

Vous pouvez toujours vérifier la zone de disponibilité pour chaque nœud principal à l’aide du portail Azure ou à l’aide de méthodes programmatiques telles que les API REST.

Pour bénéficier des avantages offerts par les zones de disponibilité en matière de résilience, votre cluster doit se trouver dans l’une des régions Azure où Azure Cosmos DB for PostgreSQL est configuré pour la résilience aux pannes de zone de disponibilité.

Étapes suivantes