Diretrizes de solução de problemas para o agente do Azure Monitor em máquinas virtuais Linux e conjuntos de dimensionamento
Visão geral do agente do Azure Monitor
Antes de ler mais, você precisa estar familiarizado com o agente do Azure Monitor e as Regras de Coleta de Dados.
Terminologia
Name | Acrônimo | Descrição |
---|---|---|
Agente do Azure Monitor | AMA | O novo agente do Azure Monitor |
Regras de coleta de dados | DCR | Regras para configurar a coleta de dados pelo agente, ou seja, o que coletar, para onde enviar e muito mais |
Serviço de Configuração do Azure Monitor | AMCS | Serviço regional hospedado no Azure, que controla a coleta de dados para esse agente e outras partes do Azure Monitor. O agente chama esse serviço para buscar DCRs. |
Ponto de extremidade de logs | -- | Ponto de extremidade para enviar dados para workspaces do Log Analytics |
Ponto de extremidade de métricas | -- | Ponto de extremidade para enviar dados para bancos de dados de Métricas do Azure Monitor. |
Serviço de Metadados de Instância e Híbrido | IMDS e HIMDS | Serviços hospedados no Azure que fornecem informações sobre máquinas virtuais em execução no momento, conjuntos de dimensionamento (via IMDS) e servidores habilitados para Arc (via HIMDS), respectivamente |
Workspace do Log Analytics | LAW | O destino no Azure Monitor para o qual você pode enviar logs coletados pelo agente |
Métricas personalizadas | -- | O destino no Azure Monitor para o qual você pode enviar métricas de convidado coletadas pelo agente |
Etapas para solucionar problemas
Siga as etapas abaixo para solucionar problemas da versão mais recente do agente do Azure Monitor em execução na máquina virtual do Linux:
Examine cuidadosamente os pré-requisitos mostrados aqui.
Verifique se a extensão foi instalada e provisionada com êxito, que instala os binários do agente em seu computador:
- Abra o portal do Azure > selecione sua máquina virtual > Abra Configurações: Extensões + aplicativos no painel à esquerda > 'AzureMonitorLinuxAgent' deve aparecer com o status: 'Provisionamento bem-sucedido'
- Se você não vir a extensão listada, verifique se o computador pode acessar o Azure e localize a extensão a ser instalada usando o comando abaixo:
az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
- Aguarde de dez a 15 minutos, pois o status da extensão pode estar em transição. Se ele ainda não aparecer como acima, desinstale a extensão e instale-a novamente.
- Verifique se você vê erros em logs de extensão localizados em
/var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/
seu computador
Verifique se o agente está em execução:
- Verifique se o agente está emitindo logs de pulsação para o workspace do Log Analytics usando a consulta abaixo. Ignore se 'Métricas Personalizadas' é o único destino na DCR:
Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
- Verifique se o serviço de agente está em execução
systemctl status azuremonitoragent
- Verifique se você vê erros em logs do agente principal localizados em
/var/opt/microsoft/azuremonitoragent/log/mdsd.*
no seu computador
- Verifique se o agente está emitindo logs de pulsação para o workspace do Log Analytics usando a consulta abaixo. Ignore se 'Métricas Personalizadas' é o único destino na DCR:
Verifique se a DCR existe e está associado à máquina virtual:
- Se estiver usando o workspace do Log Analytics como destino, verifique se a DCR existe na mesma região física que o workspace do Log Analytics.
- Abra o portal do Azure > selecione a regra de coleta de dados > Abra a folha Configuração: Recursos no painel à esquerda > Você deve ver a máquina virtual listada aqui.
- Se não estiver listada, clique em 'Adicionar' e selecione sua máquina virtual no seletor de recursos. Repita em todas as DCRs.
Verifique se o agente foi capaz de baixar as DCRs associadas do serviço AMCS:
- Verifique se você vê a DCR mais recente baixada neste local:
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
- Verifique se você vê a DCR mais recente baixada neste local:
Problemas ao coletar o Syslog
Para obter mais informações sobre como solucionar problemas de syslog com o Agente do Azure Monitor, acesse aqui.
O arquivo
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
de QoS (qualidade de serviço) fornece agregações de 15 minutos dos eventos processados em formato CSV e contém as informações sobre a quantidade de eventos de syslog processados no período de tempo especificado. Esse arquivo é útil no acompanhamento de quedas de ingestão de eventos do Syslog.Por exemplo, o fragmento abaixo mostra que nos 15 minutos anteriores a 2022-02-28T19:55:23.5432920Z, o agente recebeu 77 eventos de syslog com informações de daemon de recurso e informações de nível e enviou 77 desses eventos para a tarefa de upload. Além disso, a tarefa de upload do agente recebeu 77 e carregou com êxito todas as 77 mensagens de daemon.info.
#Time: 2022-02-28T19:55:23.5432920Z #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent ... MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77 MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0 ... MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
Etapas para solucionar problemas
Primeiro, examine as etapas genéricas de solução de problemas do AMA do Linux. Se o agente estiver emitindo pulsações, prossiga para a etapa 2.
A configuração analisada é armazenada em
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
. Verifique se a coleção Syslog está definida e os destinos de log são os mesmos construídos na interface do usuário da DCR/JSON da DCR.- Em caso afirmativo, vá para a etapa 3. Caso contrário, o problema estará no fluxo de trabalho de configuração.
- Investigue os arquivos
mdsd.err
,mdsd.warn
emdsd.info
em/var/opt/microsoft/azuremonitoragent/log
quanto a possíveis erros de configuração.
Valide o layout do fluxo de trabalho da coleção Syslog para garantir que todas as peças necessárias estejam no local e acessíveis:
- Para os usuários do
rsyslog
, verifique se o arquivo/etc/rsyslog.d/10-azuremonitoragent.conf
está presente, não está vazio e está acessível pelo daemonrsyslog
(usuário do syslog).- Verifique a configuração do rsyslog em
/etc/rsyslog.conf
e/etc/rsyslog.d/*
para ver se você tem entradas associadas a um conjunto de regras não padrão, pois as mensagens dessas entradas não serão encaminhadas para o Agente do Azure Monitor. Por exemplo, as mensagens de uma entrada configurada com um conjunto de regras não padrão comoinput(type="imtcp" port="514"
ruleset="myruleset"
)
não serão encaminhadas.
- Verifique a configuração do rsyslog em
- Para os usuários do
syslog-ng
, verifique se o arquivo/etc/syslog-ng/conf.d/azuremonitoragent.conf
está presente, não está vazio e está acessível pelo daemonsyslog-ng
(usuário do syslog). - Verifique se o arquivo
/run/azuremonitoragent/default_syslog.socket
existe e está acessível porrsyslog
ousyslog-ng
, respectivamente. - Consulte as seguintes diretrizes para verificar se a fila do daemon do syslog não está estourando, fazendo com que o upload falhe: Dados do Rsyslog não carregados devido a um problema de disco cheio no Agente Linux do AMA
- Para os usuários do
Para depurar ainda mais a ingestão de eventos de syslog, você pode acrescentar sinalizador de rastreamento -T 0x2002 no final de MDSD_OPTIONS no arquivo
/etc/default/azuremonitoragent
e reiniciar o agente:export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
Depois que o problema for reproduzido com o sinalizador de rastreamento ativado, você encontrará mais informações de depuração em
/var/opt/microsoft/azuremonitoragent/log/mdsd.info
. Inspecione o arquivo quanto à possível causa do problema de coleta de syslog, como erros de upload/análise/processamento/configuração.Aviso
Certifique-se de remover a configuração do sinalizador de rastreamento -T 0x2002 após a sessão de depuração, pois ela gera muitas instruções de rastreamento que podem preencher o disco mais rapidamente ou dificultar a análise visual do arquivo de log.
Solução de problemas no servidor habilitado para Arc
Se depois de verificar as etapas básicas de solução de problemas você não vê o Agente do Azure Monitor emitindo logs ou encontrar erros de"Falha ao obter o token MSI do ponto de extremidade do IMDS" no /var/opt/microsoft/azuremonitoragent/log/mdsd.err
arquivo de log, é provável que o usuário do syslog
não seja membro do grupo himds
. Adicione o usuário syslog
ao grupo de usuários himds
se o usuário não for membro desse grupo. Crie o usuário syslog
e o grupo syslog
, se necessário, e verifique se o usuário está nesse grupo. Para obter mais informações, consulte os requisitos de autenticação de servidor habilitado para Azure Arc aqui.