Zuverlässigkeit für Azure Private 5G Core

In diesem Artikel wird die Zuverlässigkeitsunterstützung in Azure Private 5G Core beschrieben. Es deckt sowohl die regionale Resilienz mit Verfügbarkeitszonen als auch die regionsübergreifende Notfallwiederherstellung und Geschäftskontinuität ab. Eine Übersicht über die Zuverlässigkeit in Azure finden Sie unter Azure-Zuverlässigkeit.

Sie können Azure Private 5G Core auch als hochverfügbaren Dienst auf einem Azure Stack Edge-Gerätepaar (ASE) bereitstellen. Weitere Informationen finden Sie unter Ausführen der erforderlichen Aufgaben für die Bereitstellung eines privaten Mobilfunknetzes.

Unterstützung für Verfügbarkeitszonen

Azure-Verfügbarkeitszonen sind mindestens drei physisch getrennte Gruppen von Rechenzentren innerhalb jeder Azure-Region. Die Rechenzentren innerhalb jeder Zone sind mit unabhängiger Stromversorgung, Kühlung und Netzwerkinfrastruktur ausgestattet. Bei einem Fehler in der lokalen Zone sind Verfügbarkeitszonen so konzipiert, dass regionale Dienste, Kapazität und Hochverfügbarkeit von den verbleibenden beiden Zonen unterstützt werden, wenn eine Zone betroffen ist.

Ausfälle können von Software- und Hardwareausfällen bis hin zu Ereignissen wie Erdbeben, Überflutungen und Bränden reichen. Fehlertoleranz wird durch Redundanz und logische Isolierung von Azure-Diensten erreicht. Ausführlichere Informationen zu Verfügbarkeitszonen in Azure finden Sie unter Regionen und Verfügbarkeitszonen.

Azure-Dienste mit Unterstützung von Verfügbarkeitszonen bieten das richtige Maß an Zuverlässigkeit und Flexibilität. Für die Konfiguration gibt es zwei Möglichkeiten. Sie können entweder zonenredundant mit automatischer zonenübergreifender Replikation oder zonenbasiert mit Instanzen sein, die an eine bestimmte Zone angeheftet werden. Sie können diese Ansätze auch kombinieren. Weitere Informationen zur zonalen im Vergleich zur zonenredundanten Architektur finden Sie unter Empfehlungen für die Verwendung von Verfügbarkeitszonen und Regionen.

Der Azure Private 5G Core-Dienst wird automatisch als zonenredundant in Azure-Regionen bereitgestellt, die Verfügbarkeitszonen unterstützen, wie unter Dienst- und Regionsunterstützung für Verfügbarkeitszonen aufgeführt. Wenn eine Region Verfügbarkeitszonen unterstützt, können alle in einer Region erstellten Azure Private 5G Core-Ressourcen von einer der Verfügbarkeitszonen aus verwaltet werden.

Zum Konfigurieren oder Verwalten von Verfügbarkeitszonen sind keine weiteren Maßnahmen erforderlich. Das Failover zwischen Verfügbarkeitszonen erfolgt automatisch.

Voraussetzungen

Unter Verfügbare Produkte nach Region finden Sie die Azure-Regionen, in denen Azure Private 5G Core verfügbar ist.

Zonenausfall

Bei einem zonenweiten Ausfall sollte es für die Benutzer keine Auswirkungen geben, da der Dienst automatisch auf die fehlerfreie Zone umgestellt wird. Zu Beginn eines zonenweiten Ausfalls kann es vorkommen, dass aktive ARM-Anforderungen einen Timeout oder Fehler aufweisen. Neue Anforderungen werden ohne Beeinträchtigung der Benutzer an fehlerfreie Knoten weitergeleitet, und alle fehlerhaften Vorgänge sollten erneut versucht werden. Sie können auch während des Ausfalls neue Ressourcen erstellen und bestehende Ressourcen aktualisieren, überwachen und verwalten.

Sichere Bereitstellungsverfahren

Die Anwendung stellt sicher, dass der gesamte Cloudstatus zwischen Verfügbarkeitszonen in der Region repliziert wird, sodass alle Verwaltungsvorgänge ohne Unterbrechung fortgesetzt werden. Der Paketkern wird auf dem Edge ausgeführt und ist vom Zonenfehler nicht betroffen, sodass der Dienst weiterhin für Benutzer bereitgestellt wird.

Regionsübergreifende Notfallwiederherstellung und Geschäftskontinuität

Bei der Notfallwiederherstellung (DR) geht es um die Wiederherstellung nach Ereignissen mit schwerwiegenden Auswirkungen, z. B. Naturkatastrophen oder fehlerhaften Bereitstellungen, die zu Downtime und Datenverlust führen. Unabhängig von der Ursache ist das beste Mittel gegen einen Notfall ein gut definierter und getesteter Notfallplan und ein Anwendungsdesign, die Notfallwiederherstellung aktiv unterstützt. Bevor Sie mit der Erstellung Ihres Notfallwiederherstellungsplans beginnen, lesen Sie die Empfehlungen zum Entwerfen einer Notfallwiederherstellungsstrategie.

Bei DR verwendet Microsoft das Modell der gemeinsamen Verantwortung. In einem Modell der gemeinsamen Verantwortung stellt Microsoft sicher, dass die grundlegenden Infrastruktur- und Plattformdienste verfügbar sind. Gleichzeitig replizieren viele Azure-Dienste nicht automatisch Daten oder greifen automatisch auf eine ausgefallene Region zurück, um eine regionsübergreifende Replikation in eine andere aktivierte Region durchzuführen. Für diese Dienste sind Sie dafür verantwortlich, einen Notfallwiederherstellungsplan zu erstellen, der für Ihre Workload geeignet ist. Die meisten Dienste, die auf Azure Platform as a Service (PaaS)-Angeboten laufen, bieten Funktionen und Anleitungen zur Unterstützung von Notfallwiederherstellung und Sie können dienstspezifische Funktionen zur Unterstützung einer schnellen Wiederherstellung nutzen, um Ihren Notfallwiederherstellungsplan zu entwickeln.

Azure Private 5G Core ist nur in geografischen Räumen mit mehreren Regionen (3+N) verfügbar. Der Dienst repliziert automatisch SIM-Anmeldeinformationen in eine Sicherungsregion in derselben Geografie. Dies bedeutet, dass es im Falle eines Ausfalls einer Region zu keinem Datenverlust kommt. Innerhalb von vier Stunden nach dem Fehler stehen alle Ressourcen in der fehlerhaften Region zum Anzeigen über das Azure-Portal und die ARM-Tools zur Verfügung, sind jedoch schreibgeschützt, bis die fehlerhafte Region wiederhergestellt wurde. Der am Edge ausgeführte Paketkern funktioniert weiterhin ohne Unterbrechung, und die Netzwerkkonnektivität wird beibehalten.

Microsoft ist für die Ausfallerkennung, Benachrichtigung und den Support für die Azure-Cloudaspekte des Azure Private 5G Core-Diensts verantwortlich.

Erkennung, Benachrichtigung und Verwaltung von Ausfällen

Microsoft überwacht die zugrunde liegenden Ressourcen, die den Azure Private 5G Core-Dienst in den einzelnen Regionen bereitstellen. Wenn diese Ressourcen beginnen, Fehler oder Warnungen zur Integritätsüberwachung anzuzeigen, die nicht auf eine einzelne Verfügbarkeitszone beschränkt sind, wird Microsoft den Dienst in eine andere unterstützte Region in derselben Geografie verschieben. Dies ist ein Aktiv-Aktiv-Muster. Die Dienstintegrität für eine bestimmte Region finden Sie unter Azure Service Health (Azure Private 5G Core ist im Abschnitt Netzwerk aufgeführt). Sie werden über normale Azure-Kommunikationskanäle über alle Regionsausfälle benachrichtigt.

Der Dienst repliziert mithilfe von Cosmos DB-Schreibvorgängen für mehrere Regionen automatisch die im Besitz des Diensts befindlichen SIM-Anmeldeinformationen in die Sicherungsregion, sodass es bei einem Regionsausfall zu keinem Datenverlust kommt.

Azure Private 5G Core-Ressourcen, die in der fehlerhaften Region bereitgestellt werden, werden schreibgeschützt, aber die Ressourcen in allen anderen Regionen funktionieren weiterhin ohne Beeinträchtigung. Wenn Sie jederzeit in der Lage sein müssen, Ressourcen zu schreiben, befolgen Sie die Anweisungen unter Einrichten der Notfallwiederherstellung und Ausfallerkennung, um Ihren eigenen Notfallwiederherstellungsvorgang durchzuführen und den Dienst in einer anderen Region einzurichten.

Der am Edge ausgeführte Paketkern funktioniert weiterhin ohne Unterbrechung, und die Netzwerkkonnektivität wird beibehalten.

Einrichten der Notfallwiederherstellung und Ausfallerkennung

In diesem Abschnitt wird beschrieben, welche Maßnahmen Sie ergreifen können, um sicherzustellen, dass Sie bei einem Regionsausfall über eine vollständig aktive Verwaltungsebene für den Azure Private 5G Core-Dienst verfügen. Dies ist erforderlich, wenn Sie Ihre Ressourcen im Falle eines Regionsausfalls ändern möchten.

Beachten Sie, dass dies zu einem Ausfall Ihres Paketkerndiensts führt und die Netzwerkkonnektivität mit Ihren UEs für bis zu acht Stunden unterbrochen wird. Daher wird empfohlen, dieses Verfahren nur zu verwenden, wenn ein unternehmenskritischer Grund zur Verwaltung von Ressourcen vorliegt, während die Azure-Region ausgefallen ist.

Vor einem Notfallwiederherstellungsereignis müssen Sie Ihre Ressourcenkonfiguration in einer anderen Region sichern, die Azure Private 5G Core unterstützt. Wenn der Regionsausfall auftritt, können Sie den Paketkern mithilfe der Ressourcen in Ihrer Sicherungsregion erneut bereitstellen.

Vorbereitung

Es gibt zwei Arten von Azure Private 5G Core-Konfigurationsdaten, die für die Notfallwiederherstellung gesichert werden müssen: Die Konfiguration des Mobilfunknetzes und die SIM-Anmeldeinformationen. Wir empfehlen Folgendes:

  • Aktualisieren Sie die SIM-Anmeldeinformationen in der Sicherungsregion jedes Mal, wenn Sie der primären Region neue SIMs hinzufügen.
  • Sichern Sie die Mobilfunknetzkonfiguration mindestens einmal pro Woche oder häufiger, wenn Sie häufig oder im großem Umfang Änderungen an der Konfiguration vornehmen, z. B. beim Erstellen eines neuen Standorts.

Mobilfunknetzkonfiguration

Befolgen Sie die Anweisungen unter Verschieben von Ressourcen in eine andere Region, um Ihre Azure Private 5G Core-Ressourcenkonfiguration zu exportieren und sie in die neue Region hochzuladen. Es wird empfohlen, eine neue Ressourcengruppe für Ihre Sicherungskonfiguration zu verwenden, um sie deutlich von der aktiven Konfiguration zu trennen. Sie müssen den Ressourcen neue Namen geben, um sie von den Ressourcen in Ihrer primären Region zu unterscheiden. Diese neue Region ist eine passive Sicherung. Zum Vermeiden von Konflikten müssen Sie die Paketkernkonfiguration noch nicht mit Ihrer Edgehardware verknüpfen. Speichern Sie stattdessen die Werte aus dem Feld packetCoreControlPlanes.platform für jeden Paketkern an einem sicheren Speicherort, auf den jeder Benutzer zugreifen kann, der den Wiederherstellungsvorgang ausführt (z. B. ein Speicherkonto, auf das in der internen Dokumentation verwiesen wird).

SIM-Daten

Aus Sicherheitsgründen gibt Azure Private 5G Core niemals die SIM-Anmeldeinformationen zurück, die dem Dienst im Rahmen der SIM-Erstellung bereitgestellt werden. Daher ist es nicht möglich, die SIM-Konfiguration auf die gleiche Weise wie andere Azure-Ressourcen zu exportieren. Es wird empfohlen, immer dann, wenn neue SIM-Karten zum primären Dienst hinzugefügt werden, dieselben SIM-Karten auch zum Sicherungsdienst hinzuzufügen, indem Sie den Prozess der Bereitstellung neuer SIM-Karten für das Sicherungsmobilfunknetz wiederholen.

Weitere Ressourcen

Ihre Azure Private 5G Core-Bereitstellung kann Azure Key Vaults zum Speichern von SIM-Verschlüsselungsschlüsseln oder HTTPS-Zertifikate für die lokale Überwachung verwenden. Sie müssen die Azure Key Vault-Dokumentation befolgen, um sicherzustellen, dass Ihre Schlüssel und Zertifikate in der Sicherungsregion verfügbar sind.

Wiederherstellung

Überprüfen Sie bei einem Regionsausfall zunächst, ob alle Ressourcen in Ihrer Sicherungsregion vorhanden sind, indem Sie die Konfiguration über das Azure-Portal oder die API abfragen (siehe Verschieben von Ressourcen in eine andere Region). Wenn nicht alle Ressourcen vorhanden sind, brechen Sie hier ab und folgen nicht dem Rest dieses Verfahrens. Möglicherweise können Sie den Dienst am Edgestandort ohne die Ressourcenkonfiguration nicht wiederherstellen.

Der Wiederherstellungsprozess ist für jeden Paketkern in drei Phasen unterteilt:

  1. Trennen Sie das Azure Stack Edge-Gerät von der fehlerhaften Region, indem Sie eine Zurücksetzung durchführen.
  2. Verbinden des Azure Stack Edge-Geräts mit der Sicherungsregion
  3. Führen Sie die Installation erneut durch und überprüfen Sie sie.

Sie müssen diesen Vorgang für jeden Paketkern in Ihrem Mobilfunknetz wiederholen.

Achtung

Das Wiederherstellungsverfahren führt zu einem Ausfall Ihres Paketkerndiensts und unterbricht die Netzwerkkonnektivität mit Ihren UEs für bis zu acht Stunden für jeden Paketkern. Es wird empfohlen, dieses Verfahren nur dann durchzuführen, wenn eine unternehmenskritische Notwendigkeit vorliegt, die Azure Private 5G Core-Bereitstellung während des Regionsausfalls über Azure zu verwalten.

Trennen des Azure Stack Edge-Geräts von der fehlerhaften Region

Auf dem Azure Stack Edge-Gerät wird derzeit die Paketkernsoftware ausgeführt und es wird über die fehlerhafte Region gesteuert. Um das Azure Stack Edge-Gerät von der fehlerhaften Region zu trennen und den aktiven Paketkern zu entfernen, müssen Sie die Anweisungen zum Zurücksetzen und Reaktivieren Ihres Azure Stack Edge-Geräts befolgen. Beachten Sie, dass dadurch die GESAMTE Software entfernt wird, die derzeit auf Ihrem Azure Stack Edge-Gerät ausgeführt wird, nicht nur die Paketkernsoftware. Stellen Sie also sicher, dass Sie über die Möglichkeit verfügen, jede andere Software auf dem Gerät neu zu installieren. Dadurch wird ein Netzwerkausfall für alle Geräte gestartet, die mit dem Paketkern auf diesem Azure Stack Edge-Gerät verbunden sind.

Verbinden des Azure Stack Edge-Geräts mit der neuen Region

Befolgen Sie die Anweisungen unter Kommissionieren des AKS-Clusters, um den Azure Kubernetes Service-Cluster auf Ihrem Azure Stack Edge-Gerät erneut bereitzustellen. Stellen Sie sicher, dass Sie für diese neue Installation einen anderen Namen verwenden, um Konflikte zu vermeiden, wenn die fehlerhafte Region wiederhergestellt wird. Im Rahmen dieses Prozesses erhalten Sie eine neue benutzerdefinierte Standort-ID für den Cluster, die Sie sich notieren sollten.

Neuinstallation und Überprüfung

Nehmen Sie eine Kopie der packetCoreControlPlanes.platform-Werte, die Sie in Vorbereitung gespeichert haben, und aktualisieren Sie das Feld packetCoreControlPlane.platform.customLocation mit der oben notierten benutzerdefinierten Standort-ID. Stellen Sie sicher, dass packetCoreControlPlane.platform.azureStackEdgeDevice mit der ID des Azure Stack Edge-Geräts übereinstimmt, auf dem Sie den Paketkern installieren möchten. Befolgen Sie nun die Anweisungen unter Ändern eines Paketkerns, um den Kern des Sicherungspakets mit den Plattformwerten zu aktualisieren. Dadurch wird eine Paketkernbereitstellung auf dem Azure Stack Edge-Gerät ausgelöst.

Sie sollten Ihren normalen Prozess zum Überprüfen einer neuen Standortinstallation befolgen, um sicherzustellen, dass die UE-Konnektivität und die gesamte Netzwerkfunktionalität wiederhergestellt wurde. Insbesondere sollten Sie sicherstellen, dass die Standortdashboards im Azure-Portal UE-Registrierungen anzeigen und dass Daten die Datenebene durchfließen.

Fehlerhafte Region wiederhergestellt

Wenn die fehlerhafte Region wiederhergestellt wird, sollten Sie sicherstellen, dass die Konfiguration in den beiden Regionen synchronisiert ist, indem Sie eine Sicherung von der aktiven Sicherungsregion in der wiederhergestellten primären Region durchführen. Führen Sie dazu die Schritte unter Vorbereitung aus.

Sie müssen auch alle Ressourcen in der wiederhergestellten Region überprüfen und die entfernen, die nicht durch die vorherigen Schritte zerstört wurden:

  • Für jedes Azure Stack Edge-Gerät, das Sie in die Sicherungsregion verschoben haben (gemäß den Schritten unter Wiederherstellung), müssen Sie die alte ARC-Clusterressource suchen und löschen. Die ID dieser Ressource befindet sich im Feld packetCoreControlPlane.platform.customLocation aus den Werten, die Sie in Vorbereitung gesichert haben. Der Status dieser Ressource wird Getrennt lauten, da der entsprechende Kubernetes-Cluster im Rahmen des Wiederherstellungsprozesses gelöscht wurde.
  • Für jeden Paketkern, den Sie in die Sicherungsregion verschoben haben (gemäß den Schritten unter Wiederherstellung), müssen Sie alle NFM-Objekte in der wiederhergestellten Region suchen und löschen. Diese werden in derselben Ressourcengruppe wie die Ressourcen der Paketkernsteuerungsebene aufgeführt, und der Wert für Region entspricht der wiederhergestellten Region.

Sie haben dann zwei Möglichkeiten für die laufende Verwaltung:

  • Verwenden Sie die betriebsbereite Sicherungsregion als neue primäre Region, und verwenden Sie die wiederhergestellte Region als Sicherung. Es ist keine weitere Aktion erforderlich.
  • Machen Sie die wiederhergestellte Region zur neuen aktiven primären Region, indem Sie die Anweisungen unter Verschieben von Ressourcen in eine andere Region befolgen, um wieder zur wiederhergestellten Region zu wechseln.

Testen

Wenn Sie Ihre Notfallwiederherstellungspläne testen möchten, können Sie jederzeit das Wiederherstellungsverfahren für einen einzelnen Paketkern befolgen. Beachten Sie, dass dies zu einem Dienstausfall Ihres Paketkerndiensts führt und die Netzwerkkonnektivität mit Ihren UEs für bis zu vier Stunden unterbrochen wird. Daher wird empfohlen, dies nur mit Paketkernbereitstellungen für Nicht-Produktionsumgebungen oder zu einem Zeitpunkt durchzuführen, zu dem sich ein Ausfall nicht negativ auf Ihr Geschäft auswirkt.

Nächste Schritte