Práticas de triagem para operações AKS

Uma análise de causa básica para um cluster do Serviço Kubernetes do Azure (AKS) geralmente é um desafio. Para simplificar o processo, considere a triagem de problemas usando uma abordagem de cima para baixo baseada na hierarquia de cluster. Comece no nível do cluster e faça drill down, se necessário.

Diagram that shows the hierarchy of AKS cluster components: Cluster, node pools, nodes, pods, and containers.

A seção a seguir fornece uma visão geral de uma série sobre práticas de triagem, que descreve a abordagem descendente em detalhes. Os artigos fornecem exemplos que usam um conjunto de ferramentas e painéis. Os artigos descrevem como estes exemplos destacam sintomas de problemas.

Os problemas comuns abordados nesta série incluem:

  • Problemas de rede e conectividade causados por configuração incorreta.
  • Comunicação interrompida entre o plano de controle e o nó.
  • Pressões de Kubelet causadas por recursos insuficientes de computação, memória ou armazenamento.
  • Problemas de resolução do Sistema de Nomes de Domínio (DNS).
  • Nós que ficam sem operações de entrada/saída de disco por segundo (IOPS).
  • Um pipeline de controle de admissão que bloqueia várias solicitações para o servidor de API.
  • Um cluster que não tem permissões para extrair do registro de contêiner apropriado.

Esta série não se destina a resolver problemas específicos. Para obter informações sobre como solucionar problemas específicos, consulte Solução de problemas do AKS.

Série de práticas de triagem

Passo Description
1. Avalie a saúde do cluster AKS. Verifique a integridade geral do cluster e da rede.
2. Examine a saúde dos nós e das cápsulas. Avalie a saúde dos nós de trabalhadores do AKS.
3. Monitore implantações de carga de trabalho. Certifique-se de que todas as implantações e DaemonSet recursos estejam em execução.
4. Validar os controladores de admissão. Verifique se os controladores de admissão estão funcionando conforme o esperado.
5. Verifique a conexão com o registro do contêiner. Verifique a conexão com o registro do contêiner.

Contribuidores

Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.

Autor principal:

  • Kevin Harris - Brasil | Especialista Principal de Soluções

Outros contribuidores:

Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.

Próximos passos