Solucionar problemas de falhas não prontas do nó que são seguidas por recuperações

Este artigo ajuda a solucionar cenários em que um nó dentro de um cluster do AKS (Microsoft Serviço de Kubernetes do Azure) mostra o Nó Não Pronto status, mas se recupera automaticamente para um estado saudável.

Sintomas

Você observa que seu aplicativo para de responder enquanto o nó está relatando que ele tem um status Não Pronto. No entanto, o nó se recupera automaticamente e, agora, ele está procurando uma RCA (análise de causa raiz).

Motivo

As possíveis causas desse problema incluem os seguintes cenários:

  • O servidor de API não está disponível e você está usando uma investigação de preparação para a implantação.

    Se um pod estiver em execução, mas não estiver pronto, essa situação significa que a investigação de preparação está falhando. Se a investigação de preparação falhar, o pod não será anexado ao serviço e o tráfego não será encaminhado para a instância do pod.

  • As falhas de host da VM (máquina virtual) ocorrem. Para determinar se ocorreram falhas de host de VM, marcar as seguintes fontes de informações:

Prevenção

Para evitar que esse problema ocorra no futuro, tome uma ou mais das seguintes ações:

  • Verifique se a camada de serviço está totalmente paga.
  • Reduza o número de watch solicitações e get para o servidor de API.
  • Substitua o pool de nós por um pool de nós íntegro.

Mais informações