Behandeln von Knotenfehlern, auf die Wiederherstellungen folgen

Dieser Artikel hilft bei der Problembehandlung in Szenarien, in denen ein Knoten in einem AKS-Cluster (Microsoft Azure Kubernetes Service) den Knoten nicht bereit status anzeigt, dann aber automatisch in einem fehlerfreien Zustand wiederhergestellt wird.

Problembeschreibung

Sie stellen fest, dass Ihre Anwendung nicht mehr reagiert, während der Knoten meldet, dass er über eine nicht bereit status verfügt. Der Knoten wird jedoch automatisch wiederhergestellt, und jetzt sucht er nach einer Ursachenanalyse (Root Cause Analysis, RCA).

Ursache

Mögliche Ursachen für dieses Problem sind die folgenden Szenarien:

  • Der API-Server ist nicht verfügbar, und Sie verwenden einen Bereitschaftstest für die Bereitstellung.

    Wenn ein Pod ausgeführt wird, aber nicht bereit ist, bedeutet dies, dass der Bereitschaftstest fehlschlägt. Wenn der Bereitschaftstest fehlschlägt, wird der Pod nicht an den Dienst angefügt, und der Datenverkehr wird nicht an den Pod instance weitergeleitet.

  • Hostfehler für virtuelle Computer (VM) treten auf. Überprüfen Sie die folgenden Informationsquellen, um festzustellen, ob VM-Hostfehler aufgetreten sind:

Prävention

Um dieses Problem in Zukunft zu verhindern, führen Sie eine oder mehrere der folgenden Aktionen aus:

  • Stellen Sie sicher, dass Ihre Dienstebene vollständig bezahlt ist.
  • Reduzieren Sie die Anzahl der watch Anforderungen und get an den API-Server.
  • Ersetzen Sie den Knotenpool durch einen fehlerfreien Knotenpool.

Weitere Informationen