Anleitung zur Notfallwiederherstellung - Azure SQL Managed Instance

Gilt für: Azure SQL Managed Instance

Azure SQL Managed Instance bietet eine branchenführende Hochverfügbarkeitsgarantie von mindestens 99,99 % zur Unterstützung einer Vielzahl von Anwendungen, einschließlich unternehmenskritischer Anwendungen, die immer verfügbar sein müssen. Azure SQL Managed Instance verfügt außerdem über schlüsselfertige Business-Continuity-Funktionen, mit denen Sie im Falle eines regionalen Ausfalls eine schnelle Notfallwiederherstellung durchführen können. Dieser Artikel enthält wertvolle Informationen, mit denen Sie sich im Vorfeld der Anwendungsbereitstellung vertraut machen sollten.

Obwohl wir kontinuierlich bestrebt sind, eine hohe Verfügbarkeit zu gewährleisten, kann es vorkommen, dass der Azure SQL Managed Instance-Dienst ausfällt, sodass die Datenbank nicht verfügbar ist und Ihre Anwendung beeinträchtigt wird. Wenn unsere Dienstüberwachung Probleme erkennt, die zu weit verbreiteten Konnektivitätsfehlern, Ausfällen oder Leistungsproblemen führen, deklariert der Dienst automatisch einen Ausfall, um Sie auf dem Laufenden zu halten.

Dienstunterbrechung

Bei einem Ausfall des Azure SQL Managed Instance-Diensts können Sie an den folgenden Orten zusätzliche Details zum Ausfall anzeigen:

  • Banner des Azure-Portals

    Wenn festgestellt wird, dass Ihre Subscription betroffen ist, wird in Ihren Benachrichtigungen im Azure-Portal ein Ausfallwarnung-Dienstproblem angezeigt:

    Screenshot einer Benachrichtigung über ein Problem mit dem Azure SQL Managed Instance-Dienst im Azure-Portal.

  • Hilfe und Support oder Support und Problembehandlung

    Wenn Sie ein Supportticket über Hilfe + Support oder Support + Problembehandlung erstellen, werden Informationen zu Problemen angezeigt, die sich auf Ihre Ressourcen auswirken. Wählen Sie Details zum Ausfall anzeigen aus, um weitere Informationen und eine Zusammenfassung der Auswirkungen zu erhalten. Es wird auch eine Warnung auf der Seite Neue Supportanfrage angezeigt.

    Screenshot der Seite „Hilfe und Support“ mit einer Benachrichtigung über ein aktives Dienstintegritätsproblem.

  • Dienststatus

    Die Seite Dienststatus im Azure-Portal enthält Informationen zum globalen Azure-Rechenzentrumsstatus. Suchen Sie in der Suchleiste im Azure-Portal nach „Dienststatus“, und zeigen Sie dann Dienstprobleme in der Kategorie Aktive Ereignisse an. Sie können die Integrität einzelner Ressourcen auch auf der Seite Ressourcenintegrität einer beliebigen Ressource im Menü Hilfe anzeigen. Es folgt ein Beispielscreenshot der Seite Dienststatus mit Informationen zu einem aktiven Dienstproblem in Südostasien:

    Screenshot der Dienststatus-Seite im Azure-Portal während eines Dienstproblems in Südostasien mit Anzeige des Problems und einer Karte der betroffenen Ressourcen.

  • E-Mail-Benachrichtigung

    Wenn Sie Warnungen eingerichtet haben, wird eine E-Mail-Benachrichtigung von azure-noreply@microsoft.com gesendet, wenn ein Service-Ausfall Ihre Subscription und Ihre Ressource beeinträchtigt. Der Text der E-Mail beginnt mit „Die Aktivitätsprotokollwarnung... wurde durch ein Dienstproblem für die Azure-Subscription... ausgelöst“. Weitere Informationen zu Dienststatuswarnungen finden Sie unter Erstellen von Aktivitätsprotokollwarnungen zu Dienstbenachrichtigungen über das Azure-Portal.

Wann sollte die Notfallwiederherstellung während eines Ausfalls initiiert werden?

Bei einem Dienstausfall, der sich auf Anwendungsressourcen auswirkt, sollten Sie die folgenden Vorgehensweisen in Betracht ziehen:

  • Die Azure-Teams arbeiten intensiv daran, die Dienstverfügbarkeit so schnell wie möglich wiederherzustellen, aber je nach Grundursache kann die Wiederherstellung manchmal Stunden in Anspruch nehmen. Wenn Ihre Anwendung eine solche signifikante Downtime tolerieren kann, können Sie einfach warten, bis der Dienst wiederhergestellt ist. In diesem Fall ist keine weitere Aktion erforderlich. Zeigen Sie die Integrität einzelner Ressourcen auf der Seite Ressourcenintegrität einer beliebigen Ressource im Menü Hilfe an. Auf der Seite Ressourcenintegrität finden Sie Updates und aktuelle Informationen zu einem Ausfall. Nach der Dienstwiederherstellung in Ihrer Region wird die Verfügbarkeit Ihrer Anwendung wiederhergestellt.

  • Die Wiederherstellung in einer anderen Azure-Region erfordert möglicherweise Änderungen an Anwendungsverbindungs-Zeichenfolgen oder die Verwendung einer DNS-Umleitung, was zu einem dauerhaften Datenverlust führen kann. Daher sollte die Notfallwiederherstellung nur durchgeführt werden, wenn sich die Ausfalldauer dem Recovery Time Objective (RTO) Ihrer Anwendung nähert. Wenn die Anwendung in der Produktion bereitgestellt wird, sollten Sie regelmäßig die Integrität der Anwendung überwachen und bestätigen, dass die Wiederherstellung nur dann gerechtfertigt ist, wenn ein längerer Ausfall der Konnektivität zwischen Anwendungsebene und Datenbank auftritt. Abhängig von der Downtimetoleranz Ihrer Anwendung und der möglichen Geschäftshaftung können Sie entscheiden, ob Sie auf die Wiederherstellung des Diensts warten oder selbst die Notfallwiederherstellung initiieren möchten.

Anleitungen zur Wiederherstellung nach Ausfällen

Wenn der Ausfall von Azure SQL Managed Instance in einer Region über einen längeren Zeitraum nicht gemildert wurde und sich auf die Vereinbarung zum Servicelevel (SLA) Ihrer Anwendung auswirkt, sollten Sie die folgenden Schritte in Betracht ziehen:

Geplantes Failover (kein Datenverlust) auf georeplizierter sekundärer Instanz

Wenn aktive Failover-Gruppen aktiviert sind, überprüfen Sie, ob der Status der primären und sekundären Instanzen im Azure-Portal Online ist. Wenn ja, ist die Datenebene sowohl für die primäre als auch für die sekundäre Instanz fehlerfrei.

Initiieren eines Failover von Failover-Gruppen in die sekundäre Region mithilfe von:

Hinweis

Ein geplantes Failover erfordert eine vollständige Datensynchronisierung vor dem Rollenwechsel und führt nicht zu Datenverlust. Abhängig von der Art des Dienstausfalls gibt es keine Garantie, dass ein geplantes Failover ohne Datenverlust erfolgreich ist, aber es lohnt sich, es als erste Wiederherstellungsoption zu versuchen.

Erzwungenes Failover (möglicher Datenverlust) auf georeplizierter sekundärer Instanz

Wenn das Failover nicht ordnungsgemäß abgeschlossen wird und Fehler auftreten oder wenn der Status der primären Datenbank nicht online ist, sollten Sie ein erzwungenes Failover mit möglichem Datenverlust in der sekundären Region in Betracht ziehen.

Verwenden Sie Folgendes, um ein erzwungenes Failover zu initiieren:

Geowiederherstellung

Wenn Sie die Failover-Gruppen nicht aktiviert haben, können Sie als letztes Mittel die Geowiederherstellung zur Wiederherstellung nach einem Ausfall verwenden. Geowiederherstellung verwendet georeplizierte Sicherungen als Quelle. Sie können eine Datenbank in einer Instanz in einer beliebigen Azure-Region aus den letzten georeplizierten Sicherungen wiederherstellen. Sie können eine Geowiederherstellung anfordern, auch wenn die Instanz oder die gesamte Region aufgrund eines Ausfalls nicht zugänglich ist.

Weitere Informationen zur geografischen Wiederherstellung über Azure CLI, das Azure-Portal, PowerShell oder die REST-API finden Sie unter geografische Wiederherstellung.

Konfigurieren der Datenbank nach der Wiederherstellung

Wenn Sie Geofailover oder Geowiederherstellung ausführen, um Ihre Anwendung nach einem Ausfall wiederherzustellen, müssen Sie sicherstellen, dass die Verbindung mit der neuen Instanz ordnungsgemäß konfiguriert ist, sodass der normale Anwendungsbetrieb wieder aufgenommen werden kann. Dies ist eine Prüfliste mit Aufgaben, anhand derer Sie die wiederhergestellte Datenbank für die Produktion vorbereiten können.

Wichtig

Sie sollten regelmäßige Übungen zu Ihrer Notfallwiederherstellungsstrategie durchführen, um die Anwendungstoleranz sowie alle operativen Aspekte des Wiederherstellungsverfahrens zu überprüfen. Für die anderen Ebenen Ihrer Anwendungsinfrastruktur ist möglicherweise eine Neukonfiguration erforderlich. Weitere Informationen zu resilienten Architekturschritten finden Sie in der Prüfliste für Hochverfügbarkeit und Notfallwiederherstellung.

Aktualisieren von Verbindungszeichenfolgen

  • Wenn Sie die Geowiederherstellung ausführen, müssen Sie sicherstellen, dass die Verbindung mit der neuen Instanz ordnungsgemäß konfiguriert ist, sodass der normale Anwendungsbetrieb wieder aufgenommen werden kann. Da Ihre wiederhergestellte Datenbank auf einer anderen Instanz vorliegt, müssen Sie die Verbindungszeichenfolge Ihrer Anwendung so anpassen, dass sie auf den neuen Server verweist. Weitere Informationen zum Ändern von Verbindungszeichenfolgen finden Sie unter der entsprechenden Entwicklungssprache für Ihre Verbindungsbibliothek.
  • Wenn Sie Failover-Gruppen zur Wiederherstellung nach einem Ausfall verwenden und Lese-/Schreib- und schreibgeschützte Listener in Ihren Anwendungs-Verbindungszeichenfolgen verwenden, ist keine weitere Aktion erforderlich, da Verbindungen automatisch an den neuen primären Server weitergeleitet werden.

Konfigurieren von Firewallregeln

Stellen Sie sicher, dass die für die sekundäre Instanz konfigurierten NSG- und Routingtabellen-Regeln den für die primäre Instanz konfigurierten Regeln entsprechen. Überprüfen Sie dienstgestützte Subnetzkonfiguration, um mehr zu erfahren.

Konfigurieren von Anmeldungen und Datenbankbenutzern

Erstellen Sie die Anmeldenamen, die in der master-Datenbank auf der sekundären Instanz vorhanden sein müssen, und stellen Sie sicher, dass diese Anmeldenamen über die geeigneten Berechtigungen in der master-Datenbank verfügen.

Einrichten von Telemetrie-Warnungen

Stellen Sie sicher, dass Ihre vorhandenen Warnungsregel-Einstellungen aktualisiert werden, um der neuen primären Instanz zuzuordnen. Weitere Informationen zu Datenbankwarnungsregeln finden Sie unter Empfangen von Warnbenachrichtigungen und Nachverfolgen der Dienstintegrität.

Aktivieren der Überwachung

Wenn Sie die Überwachung für die primäre Instanz konfiguriert haben, müssen Sie sie in der sekundären Instanz identisch machen. Weitere Informationen finden Sie unter Azure SQL Überwachen für Azure SQL Managed Instance.

Weitere Informationen finden Sie unter: