Como funcionam os heartbeats no Operations Manager
Importante
Esta versão do Operations Manager chegou ao fim do suporte. Recomendamos que atualize para o Operations Manager 2022.
O System Center - Operations Manager utiliza heartbeats para monitorizar canais de comunicação entre um agente e o servidor de gestão principal do agente. Um heartbeat é um pacote de dados enviados regularmente do agente para o servidor de gestão, por predefinição, a cada 60 segundos, através da porta 5723 (TCP).
Quando um agente não envia um heartbeat quatro vezes, é gerado um alerta de Falha de Heartbeat do Serviço de Estado de Funcionamento e o servidor de gestão tenta contactar o computador com ping. Se o computador não responder ao ping, é gerado um alerta Falha ao Ligar ao Computador . A ilustração seguinte mostra este processo.
Quando vir ambos os alertas, sabe que o computador não pode ser contactado pelo servidor de gestão. Quando vir apenas o alerta de falha de heartbeat, sabe que o computador pode ser contactado, mas existe um problema com o agente. Os dois alertas são fechados automaticamente quando os heartbeats continuam.
Nota
Por predefinição, os alertas para heartbeats em falta e respostas a ping estão desativadas nos sistema operativos de cliente. Para receber alertas para sistemas operativos cliente, substitua os monitores Falha de Heartbeat do Serviço de Estado de Funcionamento e Computador Não Acessível para a classe Sistema Operativo Cliente Windows e defina o parâmetro Gerar Alerta como Verdadeiro.
Para agentes que reportam a um servidor de gateway, tem de configurar a Conta de Gestão Automática de Agentes que é utilizada para diagnosticar automaticamente falhas do agente (por exemplo, falhas de heartbeat e falha ao receber dados) para que a conta Run As tenha privilégios para o Servidor de Gestão e para o gateway. Caso contrário, a tarefa de recuperação falhará num servidor de gateway. Este cenário só é suportado se:
- O servidor de gateway é membro de uma floresta fidedigna do Active Directory, mas fora do limite de confiança kerberos do grupo de gestão.
- O servidor de gateway é membro da mesma floresta do Active Directory que os servidores de gestão do Operations Manager. Neste caso, o servidor de gateway é utilizado devido a uma firewall ou membro de um agrupamento de recursos local.
O estado de funcionamento do computador gerido com agente será alterado para crítico (vermelho) quando o alerta Falha de Heartbeat no Serviço de Integridade é gerado. Para ver os detalhes do estado de funcionamento, clique com o botão direito do rato no computador em Alertas Ativos, aponte para Abrir e selecione Explorador do Estado de Funcionamento. O nó de Disponibilidade será expandido para mostrar o item crítico. Selecione Falha de Heartbeat do Serviço de Estado de Funcionamento e selecione o separador Eventos de Alteração de Estado . Verá uma lista de alterações de estado com a data e hora da ocorrência. Selecione qualquer ocorrência para apresentar informações no painel Detalhes. O estado de funcionamento mudará para Bom Estado de Funcionamento (verde) quando os heartbeats forem retomados.
Pode alterar o intervalo do heartbeat de todos os agentes e número de heartbeats em falta de todos os servidores de gestão em Definições na área de trabalho Administração, como apresentado na ilustração seguinte.
Pode também substituir o intervalo global de heartbeat de agentes individuais e o número de heartbeats em falta de servidores de gestão individuais, abrindo as propriedades do computador em Agente Gerido ou Servidores de Gestão na área de trabalho Administração. Por exemplo, pode aumentar o intervalo de heartbeat de um computador que tenha uma ligação lenta à rede.
Passos seguintes
Para saber mais sobre como investigar uma falha de heartbeat do agente e formas de resolvê-las, veja Resolver Alertas de Heartbeat.
Veja Configurar a Tarefa de Recuperação Não Acessível do Computador para Servidores de Gateway quando os agentes reportam a um servidor de gateway num ambiente de rede seguro.