Zuverlässigkeit in Community Training

Community Training ist eine cloudbasierte Azure-Lösung, die die Durchführung umfangreicher, weit verbreiteter Trainingsprogramme mit hoher Qualität und Effizienz ermöglicht. Mithilfe von Community Training können Organisationen aller Größen und Arten umfangreiche Trainingsprogramme für ihre internen und externen Communitys durchführen. Communitys können Mitarbeiter:innen mit Kundenkontakt, erweiterte Belegschaften, ein Partnerökosystem, ein Freiwilligennetzwerk und Programmempfänger:innen umfassen.

In diesem Artikel wird die Zuverlässigkeitsunterstützung in Community beschrieben, wobei sowohl regionsinterne Resilienz mittels Verfügbarkeitszonen als auch Notfallwiederherstellung und Geschäftskontinuität behandelt werden. Eine ausführlichere Übersicht über ein Prinzip der Zuverlässigkeit in Azure finden Sie unter Azure-Zuverlässigkeit.

Unterstützung für Verfügbarkeitszonen

Azure-Verfügbarkeitszonen sind mindestens drei physisch getrennte Gruppen von Rechenzentren innerhalb jeder Azure-Region. Die Rechenzentren innerhalb jeder Zone sind mit unabhängiger Stromversorgung, Kühlung und Netzwerkinfrastruktur ausgestattet. Bei einem Fehler in der lokalen Zone sind Verfügbarkeitszonen so konzipiert, dass regionale Dienste, Kapazität und Hochverfügbarkeit von den verbleibenden beiden Zonen unterstützt werden, wenn eine Zone betroffen ist.

Ausfälle können von Software- und Hardwareausfällen bis hin zu Ereignissen wie Erdbeben, Überflutungen und Bränden reichen. Fehlertoleranz wird durch Redundanz und logische Isolierung von Azure-Diensten erreicht. Ausführlichere Informationen zu Verfügbarkeitszonen in Azure finden Sie unter Regionen und Verfügbarkeitszonen.

Azure-Dienste mit Unterstützung von Verfügbarkeitszonen bieten das richtige Maß an Zuverlässigkeit und Flexibilität. Für die Konfiguration gibt es zwei Möglichkeiten. Sie können entweder zonenredundant mit automatischer zonenübergreifender Replikation oder zonenbasiert mit Instanzen sein, die an eine bestimmte Zone angeheftet werden. Sie können diese Ansätze auch kombinieren. Weitere Informationen zur zonalen im Vergleich zur zonenredundanten Architektur finden Sie unter Empfehlungen für die Verwendung von Verfügbarkeitszonen und Regionen.

Community Training verwendet Azure-Verfügbarkeitszonen, um Hochverfügbarkeit und Fehlertoleranz innerhalb einer Azure-Region zu gewährleisten. Community Training bietet Unterstützung für Verfügbarkeitszonen auf Steuer- und Datenebene:

  • Die Steuerebene ist in den primären Verfügbarkeitsregionen zonenredundant.

  • Die Datenebene kann entweder zonenspezifisch oder zonenredundant sein, je nachdem, welches Konzept Sie für Ihre Anforderungen auswählen. Es wird jedoch dringend empfohlen, eine zonenredundante Bereitstellung auszuwählen, um während eines Zonenausfalls Datenverluste zu vermeiden und die Dienstverfügbarkeit aufrechtzuerhalten.

Voraussetzungen

  • Verfügbarkeitszonen werden für die folgenden Community Training-SKUs unterstützt:

    • Standard (weniger Benutzer:innen)
    • Premium (mehr Benutzer:innen)
  • Community Training wird nur in Regionspaaren unterstützt. Jede sekundäre Region wird mit einer Zonenkonfiguration bereitgestellt. In der folgenden Tabelle sind alle Regionen aufgeführt, die Verfügbarkeitszonen für Community Training unterstützen, zusammen mit der jeweiligen gepaarten Region.

Primäre Region Gepaarte Region
UKSouth UK, Westen
AustralienOsten Australien,Südosten
EastUS USA, Westen
EastUS2 USA, Mitte
Europa, Norden Europa, Westen
WestUS3 EastUS
SwedenCentral SwedenSouth

Unterstützung für zonales Failover

Community Training verwendet viele Azure-Abhängigkeitsdienste, z. B. App-Dienst und Azure SQL. Wenn Sie eine zonenredundante Bereitstellung auswählen, erstellt Community Training auch zonenredundante Angebote dieser zugrunde liegenden Azure-Dienstressourcen. Wenn eine Zone fehlschlägt, wird für alle Ressourcen, einschließlich der Abhängigkeitsressourcen, ein Failover zu einer der fehlerfreien Zonen ausgeführt.

Erstellen einer Ressource mit aktivierter Verfügbarkeitszone

Community Training ermöglicht die Konfiguration für Verfügbarkeitszonen nur zum Zeitpunkt der Instanzerstellung. Wenn Sie die Konfiguration Ihrer Verfügbarkeitszonen nach der Instanzerstellung ändern möchten, müssen Sie eine neue Instanz erstellen. Informationen zum Erstellen Ihrer Community Training-Instanz finden Sie unter Erstellen von Community Training.

Zonenausfall

  • Zonal. Während eines zonenweiten Ausfalls kann in Community Training entweder eine vollständige oder eine partielle Dienstunterbrechung auftreten. Der Verfügbarkeitsumfang hängt von verschiedenen Faktoren ab, z. B. davon, ob das gesamte Rechenzentrum ausgefallen ist oder ob ein bestimmter Abhängigkeitsdienst in dieser Zone nicht mehr verfügbar ist.

  • Zonenredundant. Während eines zonenweiten Ausfalls sollten keine Auswirkungen auf bereitgestellte Ressourcen auftreten. Sie sollten jedoch auf eine kurze Unterbrechung der Kommunikation mit diesen Ressourcen vorbereitet sein. Wenn eine Zone ausgefallen ist, erhalten Clients meist 409-Fehlercodes, und die Wiederholungslogik versucht in entsprechenden Intervallen, die Verbindungen wiederherzustellen. Neue Anforderungen werden auf fehlerfreie Knoten geleitet, die keine Auswirkungen auf den Benutzer haben. Während zonenweiter Ausfälle können Benutzer neue Ressourcen erstellen und vorhandene erfolgreich skalieren.

Notfallwiederherstellung und Geschäftskontinuität

Bei der Notfallwiederherstellung (DR) geht es um die Wiederherstellung nach Ereignissen mit schwerwiegenden Auswirkungen, z. B. Naturkatastrophen oder fehlerhaften Bereitstellungen, die zu Downtime und Datenverlust führen. Unabhängig von der Ursache ist das beste Mittel gegen einen Notfall ein gut definierter und getesteter Notfallplan und ein Anwendungsdesign, die Notfallwiederherstellung aktiv unterstützt. Bevor Sie mit der Erstellung Ihres Notfallwiederherstellungsplans beginnen, lesen Sie die Empfehlungen zum Entwerfen einer Notfallwiederherstellungsstrategie.

Bei DR verwendet Microsoft das Modell der gemeinsamen Verantwortung. In einem Modell der gemeinsamen Verantwortung stellt Microsoft sicher, dass die grundlegenden Infrastruktur- und Plattformdienste verfügbar sind. Gleichzeitig replizieren viele Azure-Dienste nicht automatisch Daten oder greifen automatisch auf eine ausgefallene Region zurück, um eine regionsübergreifende Replikation in eine andere aktivierte Region durchzuführen. Für diese Dienste sind Sie dafür verantwortlich, einen Notfallwiederherstellungsplan zu erstellen, der für Ihre Workload geeignet ist. Die meisten Dienste, die auf Azure Platform as a Service (PaaS)-Angeboten laufen, bieten Funktionen und Anleitungen zur Unterstützung von Notfallwiederherstellung und Sie können dienstspezifische Funktionen zur Unterstützung einer schnellen Wiederherstellung nutzen, um Ihren Notfallwiederherstellungsplan zu entwickeln.

Das Microsoft Community Training-Team verwaltet das gesamte Notfallwiederherstellungsverfahren für Community Training. Die Notfallwiederherstellung ist weder „aktiv-aktiv“ noch „aktiv-passiv“, sondern sie basiert auf der Wiederherstellung aus der neuesten verfügbaren Sicherung von Azure-Diensten. Das Community Training-Team erstellt manuell alle Ressourcen in der gepaarten Region aus der Datensicherung.

Hinweis

Die Notfallwiederherstellung in Community Training wird nur in Regionspaaren unterstützt.

Notfallwiederherstellung für mehrere Regionen

  • Bei einem regionalen Notfall wird für die Steuerebene manuell ein Failover an die gepaarte Region durchgeführt. Bevor das Failover abgeschlossen ist, kann es zu einer Beeinträchtigung des Dienstes kommen. Nach dem Failover werden nur schreibgeschützte Vorgänge unterstützt, bis die Notfallregion wieder online ist. Für den Dienst wird manuell ein Failback in die ursprüngliche Region vorgenommen, sobald sie wieder online ist, und alle Vorgänge werden fortgesetzt. Das Recovery Point Objective (RPO) beträgt schätzungsweise 10 Minuten, das Recovery Time Objective (RTO) 24 Stunden.

  • Für die Datenebene bietet Community Training eine von Microsoft verwaltete Notfallwiederherstellung. Um die verwaltete Notfallwiederherstellung zu verwenden, aktivieren Sie die Notfallwiederherstellung während der Erstellung von Community Training-Instanzen in Azure. Nachdem Sie die Notfallwiederherstellung aktiviert haben, übernimmt Microsoft die Sicherung des Speichers und der Datenbank in der gepaarten Region. Das Recovery Point Objective (RPO) beträgt schätzungsweise 12 Stunden, das Recovery Time Objective (RTO) 48 Stunden.

Hinweis

RTO hängt von der Größe der Datenbank und des Speichers sowie von der Wartezeit zwischen den gepaarten Regionen ab. Datenbank- oder Speicher-VM-Kapazität (SKU). RPO hängt von zugrunde liegenden Azure-Ressourcen ab, z. B. Azure SQL und Azure-Speicher. Weitere Informationen zu RTO und RPO finden Sie unter Übersicht über die Notfallwiederherstellung.

Erkennung, Benachrichtigung und Verwaltung von Ausfällen

Wenn eine Integritätsprüfung für Community Training einen Ausfall eines beliebigen Dienstes in einer beliebigen Region erkennt, fordert Microsoft Ihre Einwilligung zum Failover in die gepaarte Region an. Microsoft informiert Sie, welche Funktionen während des Notfallwiederherstellungsvorgangs verfügbar sind. Sobald Microsoft Ihre Einwilligung erhält, kann das Community Training-Team das Notfallwiederherstellungsverfahren starten.

Wichtig

Lernende können Audio-/Videofunktionen erst wieder nutzen, wenn die primäre Region betriebsbereit ist. Sie sollten Medienuploadvorgänge vermeiden, bis der primäre Standort betriebsbereit ist.

Kapazität und proaktive Resilienz der Notfallwiederherstellung

Microsoft und seine Kunden arbeiten im Rahmen des Modells der gemeinsamen Verantwortung. Sobald eine Region ausfällt, wird nicht nur die Community Training-Instanz in die gepaarte Region migriert, sondern auch alle Workloads für Produkte und Kund:innen werden migriert. Dies kann zu einem Mangel an Ressourcen in der gepaarten Region oder im Rechenzentrum führen. Daher hängt die Verfügbarkeit der Notfallwiederherstellung von der verfügbaren Kapazität der zugrunde liegenden Azure-Ressourcen ab.

Nächste Schritte