Résoudre les échecs de nœud non prêts suivis de récupérations

Cet article vous aide à résoudre les scénarios dans lesquels un nœud au sein d’un cluster Microsoft Azure Kubernetes Service (AKS) affiche le nœud non prêt status, puis récupère automatiquement à un état sain.

Symptômes

Vous remarquez que votre application cesse de répondre pendant que le nœud signale qu’elle a un status Non prêt. Toutefois, le nœud récupère automatiquement et recherche maintenant une analyse de la cause racine (RCA).

Cause

Les causes possibles de ce problème sont les scénarios suivants :

  • Le serveur d’API n’est pas disponible et vous utilisez une sonde de préparation pour le déploiement.

    Si un pod est en cours d’exécution mais n’est pas prêt, cela signifie que la sonde de préparation échoue. Si la sonde de préparation échoue, le pod n’est pas attaché au service et le trafic n’est pas transféré au pod instance.

  • Des erreurs d’hôte de machine virtuelle se produisent. Pour déterminer si des erreurs d’hôte de machine virtuelle se sont produites, case activée les sources d’informations suivantes :

Prévention

Pour éviter que ce problème ne se produise à l’avenir, effectuez une ou plusieurs des actions suivantes :

  • Assurez-vous que votre niveau de service est entièrement payé.
  • Réduisez le nombre de watch demandes et get adressées au serveur d’API.
  • Remplacez le pool de nœuds par un pool de nœuds sain.

Informations supplémentaires