Diretrizes de solução de problemas para o agente do Azure Monitor em máquinas virtuais Linux e conjuntos de dimensionamento

Visão geral do agente do Azure Monitor

Antes de ler mais, você precisa estar familiarizado com o agente do Azure Monitor e as Regras de Coleta de Dados.

Terminologia

Name Acrônimo Descrição
Agente do Azure Monitor AMA O novo agente do Azure Monitor
Regras de coleta de dados DCR Regras para configurar a coleta de dados pelo agente, ou seja, o que coletar, para onde enviar e muito mais
Serviço de Configuração do Azure Monitor AMCS Serviço regional hospedado no Azure, que controla a coleta de dados para esse agente e outras partes do Azure Monitor. O agente chama esse serviço para buscar DCRs.
Ponto de extremidade de logs -- Ponto de extremidade para enviar dados para workspaces do Log Analytics
Ponto de extremidade de métricas -- Ponto de extremidade para enviar dados para bancos de dados de Métricas do Azure Monitor.
Serviço de Metadados de Instância e Híbrido IMDS e HIMDS Serviços hospedados no Azure que fornecem informações sobre máquinas virtuais em execução no momento, conjuntos de dimensionamento (via IMDS) e servidores habilitados para Arc (via HIMDS), respectivamente
Workspace do Log Analytics LAW O destino no Azure Monitor para o qual você pode enviar logs coletados pelo agente
Métricas personalizadas -- O destino no Azure Monitor para o qual você pode enviar métricas de convidado coletadas pelo agente

Etapas para solucionar problemas

Siga as etapas abaixo para solucionar problemas da versão mais recente do agente do Azure Monitor em execução na máquina virtual do Linux:

  1. Examine cuidadosamente os pré-requisitos mostrados aqui.

  2. Verifique se a extensão foi instalada e provisionada com êxito, que instala os binários do agente em seu computador:

    1. Abra o portal do Azure > selecione sua máquina virtual > Abra Configurações: Extensões + aplicativos no painel à esquerda > 'AzureMonitorLinuxAgent' deve aparecer com o status: 'Provisionamento bem-sucedido'
    2. Se você não vir a extensão listada, verifique se o computador pode acessar o Azure e localize a extensão a ser instalada usando o comando abaixo:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Aguarde de dez a 15 minutos, pois o status da extensão pode estar em transição. Se ele ainda não aparecer como acima, desinstale a extensão e instale-a novamente.
    4. Verifique se você vê erros em logs de extensão localizados em /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ seu computador
  3. Verifique se o agente está em execução:

    1. Verifique se o agente está emitindo logs de pulsação para o workspace do Log Analytics usando a consulta abaixo. Ignore se 'Métricas Personalizadas' é o único destino na DCR:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Verifique se o serviço de agente está em execução
      systemctl status azuremonitoragent
      
    3. Verifique se você vê erros em logs do agente principal localizados em /var/opt/microsoft/azuremonitoragent/log/mdsd.* no seu computador
  4. Verifique se a DCR existe e está associado à máquina virtual:

    1. Se estiver usando o workspace do Log Analytics como destino, verifique se a DCR existe na mesma região física que o workspace do Log Analytics.
    2. Abra o portal do Azure > selecione a regra de coleta de dados > Abra a folha Configuração: Recursos no painel à esquerda > Você deve ver a máquina virtual listada aqui.
    3. Se não estiver listada, clique em 'Adicionar' e selecione sua máquina virtual no seletor de recursos. Repita em todas as DCRs.
  5. Verifique se o agente foi capaz de baixar as DCRs associadas do serviço AMCS:

    1. Verifique se você vê a DCR mais recente baixada neste local: /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/

Problemas ao coletar o Syslog

Para obter mais informações sobre como solucionar problemas de syslog com o Agente do Azure Monitor, acesse aqui.

  • O arquivo /var/opt/microsoft/azuremonitoragent/log/mdsd.qos de QoS (qualidade de serviço) fornece agregações de 15 minutos dos eventos processados em formato CSV e contém as informações sobre a quantidade de eventos de syslog processados no período de tempo especificado. Esse arquivo é útil no acompanhamento de quedas de ingestão de eventos do Syslog.

    Por exemplo, o fragmento abaixo mostra que nos 15 minutos anteriores a 2022-02-28T19:55:23.5432920Z, o agente recebeu 77 eventos de syslog com informações de daemon de recurso e informações de nível e enviou 77 desses eventos para a tarefa de upload. Além disso, a tarefa de upload do agente recebeu 77 e carregou com êxito todas as 77 mensagens de daemon.info.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Etapas para solucionar problemas

  1. Primeiro, examine as etapas genéricas de solução de problemas do AMA do Linux. Se o agente estiver emitindo pulsações, prossiga para a etapa 2.

  2. A configuração analisada é armazenada em /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Verifique se a coleção Syslog está definida e os destinos de log são os mesmos construídos na interface do usuário da DCR/JSON da DCR.

    1. Em caso afirmativo, vá para a etapa 3. Caso contrário, o problema estará no fluxo de trabalho de configuração.
    2. Investigue os arquivos mdsd.err,mdsd.warn e mdsd.info em /var/opt/microsoft/azuremonitoragent/log quanto a possíveis erros de configuração.
  3. Valide o layout do fluxo de trabalho da coleção Syslog para garantir que todas as peças necessárias estejam no local e acessíveis:

    1. Para os usuários do rsyslog, verifique se o arquivo /etc/rsyslog.d/10-azuremonitoragent.conf está presente, não está vazio e está acessível pelo daemon rsyslog (usuário do syslog).
      1. Verifique a configuração do rsyslog em /etc/rsyslog.conf e /etc/rsyslog.d/* para ver se você tem entradas associadas a um conjunto de regras não padrão, pois as mensagens dessas entradas não serão encaminhadas para o Agente do Azure Monitor. Por exemplo, as mensagens de uma entrada configurada com um conjunto de regras não padrão como input(type="imtcp" port="514" ruleset="myruleset") não serão encaminhadas.
    2. Para os usuários do syslog-ng, verifique se o arquivo /etc/syslog-ng/conf.d/azuremonitoragent.conf está presente, não está vazio e está acessível pelo daemon syslog-ng (usuário do syslog).
    3. Verifique se o arquivo /run/azuremonitoragent/default_syslog.socket existe e está acessível por rsyslog ou syslog-ng, respectivamente.
    4. Consulte as seguintes diretrizes para verificar se a fila do daemon do syslog não está estourando, fazendo com que o upload falhe: Dados do Rsyslog não carregados devido a um problema de disco cheio no Agente Linux do AMA
  4. Para depurar ainda mais a ingestão de eventos de syslog, você pode acrescentar sinalizador de rastreamento -T 0x2002 no final de MDSD_OPTIONS no arquivo /etc/default/azuremonitoragent e reiniciar o agente:

    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Depois que o problema for reproduzido com o sinalizador de rastreamento ativado, você encontrará mais informações de depuração em /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Inspecione o arquivo quanto à possível causa do problema de coleta de syslog, como erros de upload/análise/processamento/configuração.

    Aviso

    Certifique-se de remover a configuração do sinalizador de rastreamento -T 0x2002 após a sessão de depuração, pois ela gera muitas instruções de rastreamento que podem preencher o disco mais rapidamente ou dificultar a análise visual do arquivo de log.

Solução de problemas no servidor habilitado para Arc

Se depois de verificar as etapas básicas de solução de problemas você não vê o Agente do Azure Monitor emitindo logs ou encontrar erros de"Falha ao obter o token MSI do ponto de extremidade do IMDS" no /var/opt/microsoft/azuremonitoragent/log/mdsd.err arquivo de log, é provável que o usuário do syslog não seja membro do grupo himds. Adicione o usuário syslog ao grupo de usuários himds se o usuário não for membro desse grupo. Crie o usuário syslog e o grupo syslog, se necessário, e verifique se o usuário está nesse grupo. Para obter mais informações, consulte os requisitos de autenticação de servidor habilitado para Azure Arc aqui.