Clusterfailoverszenarios auf Ihrem GPU-Gerät von Azure Stack Edge Pro

In diesem Artikel werden die allgemeinen Failoverszenarios, die Reaktion des Azure Stack Edge-Geräts und die Gesamtauswirkungen auf die im Cluster bereitgestellten Workloads im Fall eines Failovers beschrieben.

Informationen zum Failover

Azure Stack Edge kann als einzelnes eigenständiges Gerät oder als Cluster mit zwei Knoten eingerichtet werden. In einem Cluster mit zwei Knoten bieten die gruppierten Knoten Hochverfügbarkeit für Anwendungen und Dienste, die im Cluster ausgeführt werden.

Wenn einer der gruppierten Knoten ausfällt, beginnt der andere Knoten mit der Bereitstellung des Diensts. Dieser Prozess wird als Failover bezeichnet. Ein Failover kann auch auftreten, wenn Hardwarekomponenten, die einem oder beiden Knoten Ihres Geräts zugeordnet sind, z. B. Laufwerke, Netzteile (Power Supply Units, PSUs), oder ein Netzwerkfehler auftritt oder wenn Sie Ihre Geräteknoten aktualisieren.

Failoverszenarien

Ein Failover kann als Folge eines Hardwarekomponentenfehlers, eines Knotenfehlers oder beim Aktualisieren des Azure Stack Edge-Clusters auftreten.

Hardwarefehler

In diesen Tabellen werden die Fehlerszenarios für eine physische Hardwarekomponente zusammengefasst, die Ihrem Gerätecluster zugeordnet ist, z. B. eines oder mehrere Laufwerke, die Stromversorgung oder das Netzwerk.

Laufwerkfehler

Knoten A Knoten B Cluster bleibt erhalten. Failover Details
1 Laufwerk fällt aus Keine Fehler Ja Nein Der Cluster wird heruntergestuft, bis das Laufwerk ersetzt wird.
Fehler bei zwei oder mehr Laufwerken Keine Fehler Ja Nein Der Cluster wird heruntergestuft, bis das Laufwerk ersetzt wird.
Mindestens ein Laufwerk schlägt fehl. Mindestens ein Laufwerk schlägt fehl. Nein Der Cluster wird offline geschaltet.

Ausfälle von Netzteilen

Knoten A Knoten B Cluster bleibt erhalten. Failover Details
1 PSU schlägt fehl Keine Fehler Ja Nein Ein weiterer Stromausfall auf Knoten A führt zum Ausfall von Knoten B.
1 PSU schlägt fehl 1 PSU schlägt fehl Ja Nein Ein weiterer Stromausfall auf einem weiteren Knoten führt zu einem Failover.
2 PSUs schlagen fehl Keine Fehler Ja Ja Für VMs auf Knoten A wird ein Failover auf Knoten B ausgeführt.
2 PSUs schlagen fehl (TBC) 1 PSU schlägt fehl Ja Ja Für VMs auf Knoten A wird ein Failover auf Knoten B ausgeführt.
2 PSUs schlagen fehl 2 PSUs schlagen fehl Nein Der Cluster wird offline geschaltet.

Netzwerkfehler

Knoten A Knoten B Cluster bleibt erhalten. Failover Details
Fehler bei Port 1, Port 2, Port 5 oder Port 6 Keine Fehler Ja Nein Fehlerhafter Port ist nicht verfügbar. Apps, die an diesem Port lauschen, sind betroffen.
Port 3 oder Port 4 oder beide schlagen fehl. Keine Fehler Ja Ja VMs auf Knoten A führen ein Failover auf Knoten B durch.

Knotenfehler und -updates

Knotenfehler

In dieser Tabelle werden die Fehlerszenarios zusammengefasst, in denen ein gesamter Knoten in Ihrem Cluster ausgefallen ist.

Knoten A Knoten B Cluster bleibt erhalten. Failover Details
Fehler beim gesamten Knoten Keine Fehler Ja Ja VMs von Knoten A führen ein Failover auf Knoten B durch.
Fehler beim gesamten Knoten Fehler beim gesamten Knoten Nein - Der Cluster wird offline geschaltet.
Reboot Keine Fehler Ja Ja VMs von Knoten A führen ein Failover auf Knoten B durch.
Reboot Reboot Nein - Der Cluster ist offline, bis der Neustart abgeschlossen ist.
Die Kernkomponente schlägt fehl. Beispiel: Hauptplatine, DIMM und Betriebssystemdatenträger. Keine Fehler Ja Ja VMs von Knoten A führen ein Failover auf Knoten B durch.
Die Kernkomponente schlägt fehl. Beispiel: Hauptplatine, DIMM und Betriebssystemdatenträger. Die Kernkomponente schlägt fehl. Beispiel: Hauptplatine, DIMM und Betriebssystemdatenträger. Nein - Der Cluster wird offline geschaltet.

Knotenupdate

Knoten A Knoten B Cluster bleibt erhalten. Failover Details
Knotenupdate Keine Fehler Ja Ja VMs von Knoten A führen ein Failover auf Knoten B durch.
Knotenupdate 2 PSUs schlagen fehl Nein - Der Cluster wird offline geschaltet.
Knotenupdate Der gesamte Knoten schlägt fehl oder wird offline geschaltet. Nein - Der Cluster wird offline geschaltet.
Knotenupdate Reboot Nein - Der Cluster wird offline geschaltet.
Knotenupdate Kernkomponente schlägt fehl, z. B. Hauptplatine, DIMM und Betriebssystemdatenträger. Nein - Der Cluster wird offline geschaltet.

Nächste Schritte