Práticas de triagem para operações do AKS
Uma análise de causa raiz para um cluster do AKS (Serviço de Kubernetes do Azure) geralmente é desafiadora. Para simplificar o processo, considere a triagem de problemas usando uma abordagem de cima para baixo com base na hierarquia do cluster. Comece no nível do cluster e faça uma busca detalhada, se necessário.
A seção a seguir fornece uma visão geral de uma série sobre práticas de triagem, que descreve a abordagem de cima para baixo em detalhes. Os artigos fornecem exemplos que usam um conjunto de ferramentas e painéis. Os artigos descrevem como esses exemplos destacam sintomas de problemas.
Os problemas comuns abordados nesta série incluem:
- Os problemas de rede e conectividade causados por configuração inadequada.
- Comunicação interrompida entre o plano de controle e o nó.
- Pressões de Kubelet causadas por recursos insuficientes de computação, memória ou armazenamento.
- Problemas de resolução de DNS (Sistema de Nomes de Domínio).
- Nós que ficam sem operações IOPS (entrada/saída de disco por segundo).
- Um pipeline de controle de admissão que bloqueia várias solicitações para o servidor de API.
- Um cluster que não tem permissões para extrair do registro de contêiner apropriado.
Esta série não se destina a resolver problemas específicos. Para obter informações sobre como solucionar problemas específicos, consulte Solução de problemas do AKS.
A série de práticas de triagem
Etapa | Descrição |
---|---|
1. Avalie a integridade do cluster AKS. | Verifique a integridade geral do cluster e da rede. |
2. Examine a integridade do nó e do pod. | Avalie a integridade dos nós de trabalho do AKS. |
3. Monitore as implantações de carga de trabalho. | Verifique se todas as implantações e os recursos DaemonSet estejam em execução. |
4. Valide controladores de admissão. | Verifique se os controladores de admissão estão funcionando conforme o esperado. |
5. Verifique a conexão com o registro de contêiner. | Verifique a conexão com o registro de contêiner |
Colaboradores
Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.
Autor principal:
- Kevin Harris | Especialista Principal em Soluções
Outros colaboradores:
- Paolo Salvatori | Engenheiro de Clientes Principal
- Francis Simy Nazareth | Especialista Técnico Sênior
Para ver perfis não públicos no LinkedIn, entre no LinkedIn.