Empfehlungen für hoch verfügbares Design mit mehreren Regionen

Gilt für diese Empfehlung für die Zuverlässigkeitsprüfliste des Azure Well-Architected Framework:

RE:05 Fügen Sie Redundanz auf verschiedenen Ebenen hinzu, insbesondere für kritische Flows. Wenden Sie Redundanz auf die Compute-, Daten-, Netzwerk- und anderen Infrastrukturebenen gemäß den identifizierten Zuverlässigkeitszielen an.

Verwandte Leitfäden: Redundanz | mithilfe von Verfügbarkeitszonen und Regionen

In diesem Leitfaden werden die Empfehlungen für das Entwerfen einer hochverwendigen Cloudumgebung mit mehreren Regionen beschrieben. Hohe Verfügbarkeit ist ein grundlegendes Konzept für Zuverlässigkeit. Eine hoch verfügbare Architektur kann Ihnen helfen, Ausfallzeiten so weit wie möglich zu vermeiden und effizient wiederherzustellen, wenn Ausfallzeiten auftreten.

Aktiv-aktiv und aktiv-passiv sind allgemeine Architekturtypen, die je nach Plattform, auf der Sie Ihre Umgebung bereitstellen, auf unterschiedliche Weise angewendet werden können. Dieser Leitfaden konzentriert sich auf ein Cloudumgebungsdesign mit mehreren Regionen. In Azure können Sie auch eine aktive oder aktiv passive Architektur innerhalb einer einzelnen Region mithilfe von Verfügbarkeitszonen entwerfen. Ausführliche Anleitungen zum Entwerfen einer hoch verfügbaren Architektur mithilfe von Verfügbarkeitszonen finden Sie im Leitfaden zu Azure Well-Architected Framework.

Wichtige Entwurfsstrategien

Aktiv-aktiv und aktiv-passiv sind die beiden grundlegenden Ansätze zum Entwerfen einer hochverwendigen Cloudumgebung. Aktive Umgebungen sind für die Verarbeitung von Produktionslasten in jeder Region konzipiert, in der Sie Ihre Workload bereitstellen. Aktiv-passive Umgebungen sind so konzipiert, dass Produktionslasten nur in der primären Region verarbeitet werden, aber bei Bedarf nicht in die sekundäre (passive) Region übergeht. Die Auswahl der besten Azure-Regionen für Ihre Workload ist ein wichtiger Bestandteil des Entwerfens einer hochverwendigen Umgebung mit mehreren Regionen. Anleitungen zum Auswählen von Azure-Regionen finden Sie im Leitfaden "Azure-Regionen auswählen".

In diesem Abschnitt werden Die Entwurfsoptionen beschrieben, die Sie berücksichtigen sollten, wenn Sie jedes Muster auswerten und Ihre Architektur so verfeinern, dass sie Ihren Geschäftlichen Anforderungen entspricht.

Anleitungen zum Entwerfen Ihrer Workload auf wiederholbare, skalierbare Weise finden Sie unter Bereitstellungsstempelmuster . Dieses Entwurfsmuster kann Ihnen helfen, Ihr Hochverfügbarkeitsdesign für eine effiziente Verwaltung zu optimieren.

In den folgenden Abschnitten werden die Entwurfsoptionen der beiden Muster beschrieben.

Bereitstellen in aktiv aktiv für null Ausfallzeiten

  • Aktiv aktiv in Kapazität: Gespiegelte Bereitstellungsstempel in zwei oder mehr Azure-Regionen, die jeweils für die Verarbeitung von Produktionsworkloads für die Region oder Regionen konfiguriert sind, die sie bedienen und skalierbar sind, um Lasten aus anderen Regionen im Falle eines regionalen Ausfalls zu verarbeiten.

    • Netzwerk: Verwenden Sie Latenz oder gewichtetes globales Routing, um den Datenverkehr zwischen Regionen zu verteilen.

    • Datenreplikation und Konsistenz: Verwenden Sie einen global verteilten Datenspeicher wie Azure Cosmos DB für Lese- und Schreibfunktionen in mehreren Regionen. Verwenden Sie für relationale Datenbanken lesbare Replikate mit schreibgeschützten Verbindungszeichenfolge.

    • Vorteil dieses Designs: Niedrigere Betriebskosten als ein überprovisioniertes Design.

    • Nachteil dieses Designs: Mögliche Beeinträchtigung der Benutzererfahrung beim Skalieren, um die Anforderungen einer vollständigen Last zu erfüllen, wenn eine andere Region einen Ausfall erlebt.

  • Active-active overprovisioned: Gespiegelte Bereitstellungsstempel in zwei oder mehr Azure-Regionen, die jeweils überprovisioniert wurden, um Produktionsworkloads für die Region oder Regionen zu verarbeiten, die sie bedienen, und um Lasten aus anderen Regionen im Falle eines regionalen Ausfalls zu verarbeiten.

    • Netzwerk: Verwenden Sie Latenz oder gewichtetes globales Routing, um den Datenverkehr zwischen Regionen zu verteilen.

    • Datenreplikation und Konsistenz: Verwenden Sie einen global verteilten Datenspeicher wie Azure Cosmos DB für Lese- und Schreibfunktionen in mehreren Regionen. Verwenden Sie für relationale Datenbanken lesbare Replikate mit schreibgeschützten Verbindungszeichenfolge.

    • Vorteil dieses Designs: Das widerstandsfähigste Design.

    • Nachteil dieses Designs: Höhere Betriebskosten als ein skalierbares Design.

  • Häufige Vorteile beider Designs: Hohe Resilienz und geringes Risiko eines vollständigen Arbeitsauslastungsausfalls.

  • Häufige Nachteile beider Entwürfe: Höhere Betriebskosten und Verwaltungslast aufgrund verschiedener Faktoren, einschließlich der Notwendigkeit der Verwaltung der Synchronisierung des Anwendungszustands und der Daten.

Bereitstellen in aktiv-passiv für die Notfallwiederherstellung

  • Warmer Ersatz: Eine primäre Region und eine oder mehrere sekundäre Regionen. Die sekundäre Region wird mit der minimal möglichen Berechnungs- und Datengröße bereitgestellt und ohne Last ausgeführt. Diese Region wird als warme Ersatzregion bezeichnet. Beim Failover werden die Compute- und Datenressourcen skaliert, um die Last aus der primären Region zu verarbeiten.

    • Netzwerk: Verwenden Sie globales Prioritätsrouting .

    • Datenreplikation und Konsistenz: Replizieren Sie Ihre Datenbank in Ihre passive Region, und verwenden Sie die automatischen Failoverfunktionen von Plattform as a Service (PaaS)-Lösungen wie Azure Cosmos DB und Azure SQL-Datenbank.

    • Vorteil dieses Designs: Kürzeste Wiederherstellungszeit bei den aktiv-passiven Designs.

    • Nachteil dieses Designs: Höchste Betriebskosten bei den aktiv-passiven Designs.

  • Kalter Ersatz: Eine primäre Region und eine oder mehrere sekundäre Regionen. Die sekundäre Region wird skaliert, um die vollständige Last zu verarbeiten, aber alle Computeressourcen werden beendet. Diese Region wird als Kaltersatzregion bezeichnet. Sie müssen die Ressourcen vor dem Failover starten.

    • Netzwerk: Verwenden Sie globales Prioritätsrouting .

    • Datenreplikation und Konsistenz: Replizieren Sie Ihre Datenbank in Ihre passive Region, und verwenden Sie die automatischen Failoverfunktionen von PaaS-Lösungen wie Azure Cosmos DB und Azure SQL-Datenbank.

    • Vorteil dieses Designs: Niedrigere Betriebskosten als das warme Ersatzdesign.

    • Nachteil dieses Designs: Längere Wiederherstellungszeit als das warme Ersatzdesign.

  • Erneute Bereitstellung im Notfall: Eine primäre Region und eine oder mehrere sekundäre Regionen. Nur das erforderliche Netzwerk wird in der sekundären Region bereitgestellt. Operatoren müssen Bereitstellungsskripts in der sekundären Region ausführen, um die Workloads zu überschlagen. Dieser Entwurf wird im Notfall als erneute Bereitstellung bezeichnet.

    • Netzwerk: Verwenden Sie globales Prioritätsrouting .

    • Datenreplikation und Konsistenz: Bereitstellen neuer Datenbankinstanzen und Rehydratisieren der Daten aus Sicherungen.

    • Vorteil dieses Designs: Niedrigste Betriebskosten.

    • Nachteil dieses Designs: Längste Wiederherstellungszeit.

  • Häufige Vorteile von aktiv-passiven Designs: Niedrigere Betriebskosten und weniger tägliche Managementbelastung als aktive Designs. Der Anwendungsstatus muss nicht synchronisiert werden.

  • Häufige Nachteile aktiver passiver Designs: Längerer, komplexerer Wiederherstellungsprozess. Höhere Wahrscheinlichkeit, dass ein manueller Eingriff für ein erfolgreiches Failover erforderlich ist.

Hinweis

Denken Sie unabhängig von Ihrem Hochverfügbarkeitsdesign daran, Redundanz für unterstützende Dienste wie Azure DevOps-Infrastruktur, Sprungfelder, Überwachung und alle anderen wichtigen Dienste zu konfigurieren, die zum Verwalten der Workload erforderlich sind.

Azure-Erleichterung

  • Azure Front Door kombiniert die globale Routingfunktionalität von Azure Traffic Manager mit einem Content Delivery System und einer Webanwendungsfirewall, die Ihnen bei der Verwaltung Ihrer Arbeitsauslastung mit hoher Verfügbarkeit hilft.

  • Azure Cosmos DB ist eine global verteilte NoSQL-Datenbankplattform, die Ihnen dabei helfen kann, eine aktive Umgebung auszuführen und die Wahrscheinlichkeit von Ausfallzeiten zu minimieren, wenn ein regionaler Ausfall auftritt.

Zuverlässigkeitsprüfliste

Lesen Sie den vollständigen Satz von Empfehlungen.