Monitorar o desempenho, a integridade e o uso do Azure Data Explorer com métricas
As métricas de Data Explorer do Azure fornecem indicadores-chave para a integridade e o desempenho dos recursos de cluster do Azure Data Explorer. Use as métricas detalhadas neste artigo para monitorar o uso, a integridade e o desempenho do cluster Data Explorer do Azure em seu cenário específico como métricas autônomas. Você pode usar métricas como a base para Painéis do Azure e Alertas do Azure operacionais.
Para obter mais informações sobre o Azure Metrics Explorer, confira Metrics Explorer.
Pré-requisitos
- Uma assinatura do Azure. Criar uma conta gratuita do Azure.
- Um cluster e um banco de dados do Azure Data Explorer. Criar um cluster e um banco de dados.
Use as métricas para monitorar os recursos do Azure Data Explorer
- Entre no portal do Azure.
- No painel esquerdo do cluster Data Explorer do Azure, pesquise métricas.
- Selecione métricas para abrir o painel métricas e iniciar a análise no cluster.
Trabalhar no painel métricas
No painel métricas, selecione métricas específicas a serem controladas, escolha como agregar seus dados e crie gráficos de métricas para exibir em seu painel.
Os seletores de Recurso e Namespace de métrica são previamente selecionados para o cluster do Azure Data Explorer. Os números na imagem a seguir correspondem à lista numerada abaixo. Eles orientam você pelas diferentes opções de configuração e exibição de suas métricas.
- Para criar um gráfico de métrica, selecione nome da Métrica e Agregação relevante por métrica. Para obter mais informações sobre métricas diferentes, consulte métricas do Azure Data Explorer com suporte.
- Selecione Adicionar métrica para ver várias métricas plotadas no mesmo gráfico.
- Para vários gráficos em uma única exibição, selecione o botão + Novo gráfico.
- Use o seletor de tempo para alterar o intervalo de tempo (padrão: últimas 24 horas).
- Use Adicionar filtro e Aplicar divisão para métricas que têm dimensões.
- Selecione Fixar no painel para adicionar a configuração do gráfico aos painéis para que você possa exibi-lo novamente.
- Defina Nova regra de alerta para visualizar suas métricas usando os critérios definidos. A nova regra de alerta incluirá seu recurso de destino, métrica, divisões e dimensões de filtro do seu gráfico. Modifique essas configurações usando o painel criação de regra de alerta.
Métricas do Azure Data Explorer com suporte
As métricas de do Azure Data Explorer fornecem informações sobre o desempenho geral e o uso dos recursos, bem como sobre ações específicas, como ingestão ou consulta. As métricas neste artigo foram agrupadas por tipo de uso.
Os tipos de métricas são:
- Métricas de cluster
- Exportar métricas
- Métricas de ingestão
- Métricas da ingestão de streaming
- Métricas de consulta
- Métricas de exibição materializada
Para obter uma lista alfabética das métricas de Azure Monitor para o Azure Data Explorers, consulte métricas de cluster do Azure Data Explorer com suporte.
Métricas de cluster
As métricas de cluster rastreiam a integridade geral do cluster. Por exemplo, uso de recursos e ingestão e capacidade de resposta.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
Utilização do cache (preterido) | Percentual | Avg, Max, Min | A porcentagem de recursos de cache alocados atualmente em uso pelo cluster. O cache é o tamanho do SSD alocado para a atividade do usuário de acordo com a política de cache definida. Uma utilização média de cache de até 80% é um estado sustentável para um cluster. Se a utilização média do cache estiver acima de 80%, o cluster deverá ser escalado verticalmente para um tipo de preço com otimização de armazenamento ou escalado horizontalmente para mais instâncias. Como alternativa, adapte a política de cache para menos dias no cache. Se a utilização do cache for superior a 100%, o tamanho dos dados a serem armazenados nele será maior que o tamanho total do cache no cluster. Essa métrica foi preterida e é apresentada somente para compatibilidade com versões anteriores. Em vez disso, use a métrica ‘Fator de utilização do cache’. |
Nenhum |
Fator de utilização de cache | Percentual | Avg, Max, Min | A porcentagem de espaço em disco utilizado dedicado ao cache quente no cluster. 100% significa que o espaço em disco atribuído aos dados de acesso frequente é utilizado de maneira ideal. Nenhuma ação é necessária, e o cluster está totalmente adequado. Menos de 100% significa que o espaço em disco atribuído aos dados de acesso frequente não é totalmente utilizado. Mais de 100% significa que o espaço em disco do cluster não é grande o suficiente para acomodar os dados de acesso frequente, conforme definido pelas políticas de cache. Para garantir que o espaço suficiente esteja disponível para todos os dados ativos, o volume de dados de acesso frequente precisa ser reduzido ou o cluster precisa ser escalado horizontalmente. Recomendamos habilitar a escala automática. |
Nenhum |
CPU | Percentual | Avg, Max, Min | A porcentagem de recursos de computação alocados atualmente em uso por máquinas no cluster. Uma CPU média de 80% ou menos é sustentável para um cluster. O valor máximo da CPU é 100%, o que significa que não há recursos de computação adicionais para processar dados. Quando um cluster não estiver com um bom desempenho, verifique o valor máximo da CPU para determinar se há CPUs específicas bloqueadas. |
Nenhum |
Utilização da ingestão | Percentual | Avg, Max, Min | A porcentagem de recursos reais usados para ingerir dados do total de recursos alocados, na política de capacidade, para executar a ingestão. A política de capacidade padrão não tem mais de 512 operações simultâneas de ingestão ou 75% dos recursos de cluster investidos na ingestão. A utilização média de ingestão de até 80% é um estado sustentável para um cluster. O valor máximo de utilização de ingestão é 100%, o que significa que toda a capacidade de ingestão de clusters, podendo resultar em uma fila de ingestão. |
Nenhum |
InstanceCount | Count | Avg | A contagem total de instâncias. | |
Keep alive | Count | Avg | Acompanha a rapidez de resposta do cluster. Um cluster totalmente responsivo retorna o valor 1 e um cluster bloqueado ou desconectado retorna 0. |
|
Número total de comandos limitados | Count | Avg, Max, Min, Sum | O número de comandos restritos (rejeitados) no cluster, pois o número máximo permitido de comandos simultâneos (paralelos) foi atingido. | Nenhum |
Número total de extensões | Count | Avg, Max, Min, Sum | O número total de extensões de dados no cluster. As alterações nessa métrica podem implicar grandes alterações na estrutura de dados e alta carga no cluster, uma vez que a mesclagem de extensões de dados é uma atividade que exige muito da CPU. |
Nenhum |
Latência do seguidor | Milissegundos | Avg, Max, Min | O banco de dados de seguidores sincroniza as alterações nos bancos de dados de líderes. Devido à sincronização, há um atraso de dados de alguns segundos a alguns minutos na disponibilidade dos dados. Essa métrica mede o comprimento do atraso de tempo. O atraso de tempo depende de vários fatores como: o tamanho geral e a taxa dos dados ingeridos para o líder, o número de bancos de dados seguidos, a taxa de operações internas executadas no líder (operações de mesclagem/recompilação). Essa é uma métrica de nível de cluster: os seguidores capturam metadados de todos os bancos de dados seguidos. Essa métrica representa a latência do processo. |
Nenhum |
Exportar métricas
As métricas de exportação controlam a integridade geral e o desempenho de operações de exportação como atraso, resultados, número de registros e utilização.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
Número de registros exportados em exportação contínua | Count | Sum | O número de registros exportados em todos os trabalhos de exportação contínua. | ContinuousExportName |
Atraso máximo de exportação contínua | Count | Max | O atraso (em minutos) relatado pelos trabalhos de exportação contínua no cluster. | Nenhum |
Contagem de exportação contínua pendente | Count | Max | O número de trabalhos de exportação contínua pendentes. Esses trabalhos estão prontos para serem executados, mas aguardando em uma fila, possivelmente devido à capacidade insuficiente). | |
Resultado da exportação contínua | Contagem | Count | O resultado de falha/êxito de cada execução de exportação contínua. | ContinuousExportName |
Utilização da exportação | Percentual | Max | A capacidade de exportação utilizada, em relação à capacidade total de exportação no cluster (entre 0 e 100). | Nenhum |
Métricas de ingestão
As métricas de ingestão controlam a integridade geral e o desempenho das operações de ingestão, como latência, resultados e volume. Para refinar sua análise:
- Aplique filtros a gráficos para plotar dados parciais por dimensões. Por exemplo, explore a ingestão para um
Database
específico. - Aplique a divisão a um gráfico para visualizar dados por componentes diferentes. Esse processo é útil para analisar as métricas que são relatadas por cada etapa do pipeline de ingestão, por exemplo
Blobs received
.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
Contagem de blob do lote | Count | Avg, Max, Min | O número de fontes de dados em um lote concluído para ingestão. | Backup de banco de dados |
Duração do lote | Segundos | Avg, Max, Min | A duração da fase de envio em lote no fluxo de ingestão. | Backup de banco de dados |
Tamanho do lote | Bytes | Avg, Max, Min | O tamanho de dados esperado não compactado em um lote agregado para ingestão. | Backup de banco de dados |
Lotes processados | Count | Sum, Max, Min | O número de lotes concluídos para ingestão. Batching Type : o gatilho usado para lacrar um lote. Para obter uma lista completa dos tipos de envio em lote, confira Tipos de envio em lote. |
Banco de dados, tipo de lote |
Blobs recebidos | Count | Sum, Max, Min | O número de blobs recebidos do fluxo de entrada por um componente. Use aplicar divisão para analisar cada componente. |
Banco de dados, Tipo de componente, nome do componente |
Blobs processados | Count | Sum, Max, Min | O número de blobs processados por um componente. Use aplicar divisão para analisar cada componente. |
Banco de dados, Tipo de componente, nome do componente |
Blobs removidos | Count | Sum, Max, Min | O número de blobs descartados permanentemente por um componente. Para cada blob, uma métrica Ingestion result com um motivo de falha é enviada. Use aplicar divisão para analisar cada componente. |
Banco de dados, Tipo de componente, nome do componente |
Latência de descoberta | Segundos | Avg | Tempo do enfileiramento de dados até a descoberta por conexões de dados. Esse tempo não está incluído na Latência de preparo nem nas métricas de Latência de ingestão. A latência de descoberta pode aumentar nas seguintes situações:
|
Tipo de componente, nome do componente |
Eventos recebidos | Count | Sum, Max, Min | O número de eventos recebidos por conexões de dados do fluxo de entrada. | Tipo de componente, nome do componente |
Eventos processados | Count | Sum, Max, Min | O número de eventos processados por conexões de dados. | Tipo de componente, nome do componente |
Eventos removidos | Count | Sum, Max, Min | O número de eventos descartados permanentemente por conexões de dados. Para cada evento, uma métrica Ingestion result com um motivo de falha é enviada. |
Tipo de componente, nome do componente |
Latência de ingestão | Segundos | Avg, Max, Min | A latência dos dados ingeridos, desde o momento em que os dados foram recebidos no cluster até que estejam prontos para consulta. O período de latência de ingestão depende do cenário de ingestão.Ingestion Kind : ingestão em streaming ou ingestão em fila |
Tipo de ingestão |
Resultados da ingestão | Count | Sum | O número total de fontes que falharam ou conseguiram ser ingeridas.Status : Êxito para ingestão bem-sucedida ou a categoria de falha para falhas. Para ver uma lista completa das possíveis categorias de falha, consulte Códigos de erro de ingestão Azure Data Explorer. Failure Status Type : se a falha é permanente ou transitória. Para ingestão bem-sucedida, essa dimensão é None .Observação:
|
Status, Tipo de Status de Falha |
Volume de ingestão (em bytes) | Count | Max, Sum | O tamanho total dos dados ingeridos para o cluster (em bytes) antes da compactação. | Backup de banco de dados |
Tamanho da fila | Count | Avg | O número de mensagens pendentes na fila de entrada de um componente. O componente do gerenciador de lote tem uma mensagem por blob. O componente do gerenciador de ingestão tem uma mensagem por lote. Um lote é um único comando de ingestão com um ou mais blobs. | Tipo de componente |
Mensagem mais antiga da fila | Segundos | Avg | O tempo em segundos a partir do momento em que a mensagem mais antiga na fila de entrada de um componente foi inserida. | Tipo de componente |
Tamanho dos dados recebidos em bytes | Bytes | Avg, Sum | O tamanho dos dados recebidos pelas conexões de dados do fluxo de entrada. | Tipo de componente, nome do componente |
Latência de preparo | Segundos | Avg | O tempo desde o momento em que uma mensagem é aceita pelo Azure Data Explorer até que seu conteúdo seja recebido por um componente de ingestão para processamento. Use aplicar filtros e selecione Tipo de Componente > StorageEngine para mostrar a latência total da ingestão. |
Banco de dados, Tipo de componente |
Métricas da ingestão de streaming
As métricas de ingestão de streaming acompanham os dados de ingestão de streaming e a taxa de solicitação, a duração e os resultados.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
Taxa de Dados de Ingestão de Streaming | Count | RateRequestsPerSecond | O volume total de dados ingeridos no cluster. | Nenhum |
Duração da Ingestão de Streaming | Milissegundos | Avg, Max, Min | A duração total de todas as solicitações de ingestão de streaming. | Nenhum |
Taxa de Solicitação de Ingestão de Streaming | Count | Count, Avg, Max, Min, Sum | O número total de solicitações de ingestão de streaming. | Nenhum |
Resultado da Ingestão de Streaming | Count | Avg | O número total de solicitações de ingestão de streaming por tipo de resultado. | Resultado |
Métricas de consulta
As métricas de desempenho de consulta acompanham a duração da consulta e o número total de consultas simultâneas ou limitadas.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
Duração da consulta | Milissegundos | Avg, Min, Max, Sum | O tempo total até que os resultados da consulta sejam recebidos (não inclui a latência de rede). | QueryStatus |
QueryResult | Contagem | Count | O número total de consultas. | QueryStatus |
Número total de consultas simultâneas | Count | Avg, Max, Min, Sum | O número de consultas são executados em paralelo no cluster. Essa métrica é uma boa maneira de estimar a carga no cluster. | Nenhum |
Número total de consultas limitadas | Count | Avg, Max, Min, Sum | O número de consultas limitadas (rejeitadas) no cluster. O número máximo de consultas simultâneas (paralelas) permitidas é definido na política de limite de taxa de solicitação. | Nenhum |
Métricas de exibição materializada
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
MaterializedViewHealth | 1, 0 | Avg | O valor será 1 se a exibição for considerada íntegra, caso contrário, 0. | Banco de Dados, MaterializedViewName |
MaterializedViewAgeSeconds | Segundos | Avg | O age da exibição é definido pela hora atual menos o último tempo de ingestão processado pela exibição. O valor da métrica é tempo em segundos (quanto menor for o valor, a exibição será "mais íntegra"). |
Banco de Dados, MaterializedViewName |
MaterializedViewResult | 1 | Avg | A métrica inclui uma Result dimensão que indica o resultado do último ciclo de materialização (consulte a métrica MaterializedViewResult para obter detalhes sobre os valores possíveis). O valor da métrica sempre é igual a 1. |
Banco de Dados, MaterializedViewName, Resultado |
MaterializedViewRecordsInDelta | Contagem de registros | Avg | O número de registros atualmente na parte não processada da tabela de origem. Para obter mais informações, consulte Padrão de exibição materializada | Banco de Dados, MaterializedViewName |
MaterializedViewExtentsRebuild | Contagem de extensões | Avg | O número de extensões que exigiram atualizações no ciclo de materialização. | Banco de Dados, MaterializedViewName |
MaterializedViewDataLoss | 1 | Max | A métrica é acionada quando os dados de origem não processados estão se aproximando da retenção. Indica que a exibição materializada não é não íntegra. | Banco de Dados, MaterializedViewName, Tipo |
Particionamento de métricas
As métricas de particionamento monitoram o processo de particionamento para tabelas com uma política de particionamento.
Métrica | Unidade | Agregação | Descrição da métrica | Dimensões |
---|---|---|---|---|
PartitioningPercentage | Percentual | Avg, Min, Max | A porcentagem de registros particionados em relação ao número total de registros. | Banco de dados, tabela |
PartitioningPercentageHot | Percentual | Avg, Min, Max | A porcentagem de registros particionados relacionada ao número total de registros (somente no cache 'quente'). | Banco de dados, tabela |
ProcessedPartitionedRecords | Percentual | Avg, Min, Max, Sum | O número de registros particionados na janela de tempo medida. | Banco de dados, tabela |