Monitorar a integridade dos backups usando as métricas do Backup do Azure (versão prévia)

Artigo
09/11/2024

O Backup do Azure fornece um conjunto de métricas internas por meio do Azure Monitor que permitem monitorar a integridade dos backups. Ele também permite que você configure regras de alerta que disparam quando as métricas excedem os limites definidos.

O Backup do Azure oferece os seguintes recursos principais:

Capacidade de exibir métricas integradas relacionadas ao backup e à restauração da integridade de seus itens de backup junto com as tendências associadas
Capacidade de programar regras de alerta personalizadas nessas métricas para monitorar com eficiência a integridade dos itens de backup
Capacidade de encaminhar alertas de métricas acionados para diferentes canais de notificação compatíveis com o Azure Monitor, como email, ITSM, webhook, aplicativos lógicos e assim por diante.

Saiba mais sobre as métricas do Azure Monitor.

Cenários com suporte

Dá suporte a métricas internas aos seguintes tipos de carga de trabalho:
- VM do Azure, Bancos de Dados SQL na VM do Azure
- Bancos de dados SAP HANA na VM do Azure
- Arquivos do Azure
- Blobs do Azure.
No momento, não há suporte a métricas para o tipo de carga de trabalho da instância do HANA.
As métricas podem ser exibidas para todos os cofres dos Serviços de Recuperação em cada região e assinatura, um de cada vez. No momento, não há suporte à exibição de métricas de um escopo maior no portal do Azure. Os mesmos limites também são aplicáveis na configuração de regras de alerta de métrica.

Métricas internas com suporte

Atualmente, o Backup do Azure dá suporte às seguintes métricas:

Eventos de Integridade do Backup: o valor da métrica representa a contagem de eventos de integridade relativos à integridade do trabalho de backup que foram acionados para o cofre em determinado período. Quando um trabalho de backup é concluído, o serviço Backup do Azure cria um evento de integridade de backup. Com base no status do trabalho (por exemplo, êxito ou falha), as dimensões associadas ao evento variam.
Restaurar Eventos de Integridade: o valor da métrica representa a contagem de eventos de integridade relativos à integridade do trabalho de restauração que foram acionados para o cofre em determinado período. Quando um trabalho de restauração é concluído, o serviço Backup do Azure cria um evento de integridade de restauração. Com base no status do trabalho (por exemplo, êxito ou falha), as dimensões associadas ao evento variam.

Observação

Damos suporte a Eventos de Restauração de Integridade somente para a carga de trabalho de Blobs do Azure, pois os backups são contínuos e não há noção de trabalhos de backup aqui.

Por padrão, as contagens são exibidas no nível do cofre. Para exibir as contagens de um item de backup e status do trabalho específicos, você pode filtrar as métricas em qualquer uma das dimensões com suporte.

A tabela abaixo lista as dimensões compatíveis com os Eventos de Integridade de Backup e as métricas de Eventos de Integridade de Restauração:

Nome da dimensão	Descrição
ID da fonte de dados	O ID exclusivo da fonte de dados associada ao trabalho. Para recursos do Azure, como VMs e Arquivos, ele contém o ID do ARM (ID do Azure Resource Manager) do recurso. Por exemplo, `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM` Para Bancos de Dados SQL/HANA dentro de VMs, ele contém o ID do ARM da VM seguida por detalhes do banco de dados. Por exemplo, `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.Compute/virtualMachines/testVM/providers/Microsoft.RecoveryServices/backupProtectedItem/SQLDataBase;mssqlserver;msdb` Para o backup do banco de dados SQL AG, o campo ID da fonte de dados está vazio, pois não há nenhuma fonte de dados (VM) nesses cenários. Para exibir as métricas de um banco de dados específico em um AG, use o campo ID da Instância de Backup.
Tipo de Fonte de Dados	O tipo da fonte de dados associada ao trabalho. Abaixo estão os tipos de fonte de dados com suporte: Microsoft.Compute/virtualMachines (Máquinas Virtuais do Microsoft Azure) Microsoft.Storage/storageAccounts/fileServices/shares (Arquivos do Azure) SQLDatabase (SQL na VM do Azure) SAPHANADataBase (SAP HANA na VM do Azure)
ID de Instância do Backup	O ID do ARM da instância de backup associada ao trabalho. Por exemplo, `/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/testRG/providers/Microsoft.RecoveryServices/vaults/testVault/backupFabrics/Azure/protectionContainers/IaasVMContainer;iaasvmcontainerv2;testRG;testVM/protectedItems/VM;iaasvmcontainerv2;testRG;testVM`
Nome da Instância de Backup	Nome amigável da instância de backup para facilitar a leitura. Ele está no formato `{protectedContainerName};{backupItemFriendlyName}`. Por exemplo, `testStorageAccount;testFileShare`
Status de integridade	Representa a integridade do item de backup após a conclusão do trabalho. Ele pode usar um dos seguintes valores: Íntegro, Transitório Não Íntegro, Persistente Não Íntegro, Transitório Degradado, Persistente Degradado. Quando um trabalho de backup/restauração é bem-sucedido, um evento de integridade com status Íntegro é exibido. Não Íntegro aparece em falhas de trabalho devido a erros de serviço; Degradado aparece em falhas devido a erros de usuário. Quando o mesmo erro ocorre no mesmo item de backup repetidamente, o estado muda de Transitório Não Íntegro/Degradado para Persistente Não Íntegro/Degradado.

Cenários de monitoramento

Exibir as métricas no portal do Azure

Para exibir as métricas no portal do Azure, siga as etapas abaixo:

Vá para o Centro de Backup no portal do Azure e clique em Métricas no menu.
Selecione um cofre ou um grupo de cofres dos quais você deseja exibir as métricas.

Atualmente, o escopo máximo para o qual você pode exibir as métricas é: todos os cofres dos Serviços de Recuperação em determinada assinatura e região. Por exemplo, Todos os cofres dos Serviços de Recuperação no Leste dos EUA em TestSubscription1.
Selecione uma métrica para exibir Eventos de Integridade de Backup ou Eventos de Integridade de Restauração.

Isso renderiza um gráfico que mostra a contagem de eventos de integridade dos cofres. Você pode ajustar o intervalo de tempo e a granularidade de agregação usando os filtros na parte superior da tela.
Para filtrar as métricas por dimensões diferentes, clique no botão Adicionar Filtro e selecione os valores de dimensão relevantes.
- Por exemplo, se você quiser ver contagens de eventos de integridade somente para backups da VM do Azure, adicione um filtro Datasource Type = Microsoft.Compute/virtualMachines.
- Para exibir eventos de integridade de uma instância de fonte de dados ou de backup específica no cofre, use os filtros de ID da fonte de dados/ID da instância de backup.
- Para exibir eventos de integridade somente de backups com falha, use um filtro em HealthStatus selecionando os valores correspondentes ao estado de integridade não íntegro ou degradado.

Configurar alertas e notificações em suas métricas

Para configurar alertas e notificações em suas métricas, siga estas etapas:

Clique em Nova Regra de Alerta na parte superior dos gráficos de métrica.
Selecione o escopo para o qual você deseja criar alertas.

Os limites do escopo são os mesmos descritos na seção Exibir métricas.
Selecione a condição na qual o alerta deve ser acionado.

Por padrão, alguns campos são preenchidos previamente com base nas escolhas no gráfico de métrica. Você pode editar os parâmetros conforme a necessidade. Para gerar alertas individuais para cada fonte de dados no cofre, use a escolha de dimensões na regra de alertas de métrica. Abaixo estão alguns cenários:
- Acionamento de alertas em trabalhos de backup com falha para cada fonte de dados:
  
  Regra de Alerta: acionar um alerta se os Eventos de Integridade de Backup > 0 nas últimas 24 horas para:
  - Dimensions["HealthStatus"]= “Persistente Não Íntegro / Transitório Não Íntegro”
  - Dimensions["DatasourceId"]= “Todos os valores atuais e futuros”
- Acionamento de alertas se todos os backups no cofre foram bem-sucedidos durante o dia:
  
  Regra de Alerta: acionar um alerta se os Eventos de Integridade de Backup < 1 nas últimas 24 horas para:
  - Dimensions ["HealthStatus"] = "Persistente Não Íntegro/Transitório Não Íntegro/Persistente Degradado/Transitório Degradado"
Observação

Se você selecionar mais dimensões como parte da condição de regra de alerta, o custo aumentará (ele é proporcional ao número de combinações exclusivas dos valores de dimensão possíveis). A escolha de mais dimensões permite que você obtenha mais contexto em um alerta acionado.
Para configurar notificações desses alertas usando Grupos de Ações, configure um Grupo de Ações como parte da regra de alerta ou crie uma regra de ação separada.

Damos suporte a vários canais de notificação, como email, ITSM, webhook, Aplicativo Lógico, SMS. Saiba mais sobre Grupos de Ações.
Configurar o comportamento de resolução automática: você pode configurar alertas de métrica como sem estado ou com estado conforme a necessidade.
- Para gerar um alerta em cada falha de trabalho, independentemente de a falha ser devido à mesma causa subjacente (comportamento sem estado), desmarque a opção Resolver alertas automaticamente na regra de alerta.
- Como alternativa, para configurar os alertas como com estado, marque a mesma caixa de seleção. Portanto, quando um alerta de métrica é acionado no escopo, outra falha não criará um novo alerta de métrica. O alerta será resolvido automaticamente se a condição de geração de alerta for avaliada como falsa em três ciclos de avaliação sucessivos. Novos alertas serão gerados se a condição for avaliada como verdadeira novamente.

Saiba mais sobre comportamento com e sem estado dos alertas de métrica do Azure Monitor.

Gerenciamento de alertas

Para exibir seus alertas de métricas acionados, siga estas etapas:

Vá até o Centro de Backup>Alertas.
Filtre por Tipo de Sinal = Métrica e por Tipo de Alerta = Configurado.
Clique em um alerta para exibir mais detalhes sobre o alerta e alterar seu estado.

Observação

O alerta tem dois campos, Monitorar condição (acionado/resolvido) e Estado do Alerta (novo/ACK/fechado) .

Estado do alerta: você pode editar esse campo (conforme mostrado na captura de tela abaixo).
Monitorar condição: não é possível editar esse campo. Esse campo é usado mais em cenários em que o serviço em si resolve o alerta. Por exemplo, o comportamento de resolução automática em alertas de métrica usa o campo Monitorar condição para resolver um alerta.

Alertas de fonte de dados e Alertas globais

Com base na configuração de regras de alerta, o alerta acionado aparece na seção Alertas da Fonte de Dados ou Alertas Globais no Centro de Backup:

Se o alerta tiver uma dimensão de ID de fonte de dados associada a ele, o alerta acionado aparecerá em Alertas de fonte de dados.
Se o alerta não tiver uma dimensão de ID da fonte de dados associada a ele, o alerta acionado aparecerá em Alertas Globais, uma vez que não há nenhuma informação que vincule o alerta a uma fonte de dados específica.

Saiba mais sobre fonte de dados e alertas globais aqui

Observação

No momento, em caso de alertas de restauração de blobs, os alertas serão exibidos em alertas de fonte de dados somente se você selecionar as dimensões – datasourceId e datasourceType ao criar a regra de alerta. Se as dimensões não forem selecionadas, os alertas serão exibidos em alertas globais.

Acessando métricas programaticamente

Você pode usar os vários clientes programáticos, como PowerShell, CLI ou API REST, para acessar a funcionalidade de métricas. Veja a documentação da API REST do Azure Monitor para obter mais detalhes.

Cenários de alerta de exemplo

Dispare um alerta se todos os backups acionados para um cofre foram bem-sucedidos nas últimas 24 horas

Regra de Alerta: disparar um alerta se Eventos de Integridade de Backup < 1 nas últimas 24 horas para:

Dimensions["HealthStatus"] != "Healthy"

Disparar um alerta após cada trabalho de backup com falha

Regra de Alerta: disparar um alerta se Eventos de Integridade de Backup > 0 nos últimos 5 minutos para:

Dimensions["HealthStatus"]!= "Healthy"
Dimensions["DatasourceId"]= "Todos os valores atuais e futuros"

Disparar um alerta se houver falhas de backup consecutivas para o mesmo item nas últimas 24 horas

Regra de Alerta: disparar um alerta se Eventos de Integridade de Backup > 1 nas últimas 24 horas para:

Dimensions["HealthStatus"]!= "Healthy"
Dimensions["DatasourceId"]= "Todos os valores atuais e futuros"

Disparar um alerta se nenhum trabalho de backup foi executado para um item nas últimas 24 horas

Regra de Alerta: acionar um alerta se os Eventos de Integridade de Backup < 1 nas últimas 24 horas para:

Dimensions["DatasourceId"]= "Todos os valores atuais e futuros"

Compartilhar via

Monitorar a integridade dos backups usando as métricas do Backup do Azure (versão prévia)

Cenários com suporte

Métricas internas com suporte

Cenários de monitoramento

Exibir as métricas no portal do Azure

Configurar alertas e notificações em suas métricas

Gerenciamento de alertas

Alertas de fonte de dados e Alertas globais

Acessando métricas programaticamente

Cenários de alerta de exemplo

Dispare um alerta se todos os backups acionados para um cofre foram bem-sucedidos nas últimas 24 horas

Disparar um alerta após cada trabalho de backup com falha

Disparar um alerta se houver falhas de backup consecutivas para o mesmo item nas últimas 24 horas

Disparar um alerta se nenhum trabalho de backup foi executado para um item nas últimas 24 horas

Próximas etapas

Comentários

Recursos adicionais