Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Cabeçalhos de tabela

Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - Nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.

Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.

Categoria Metric Nome na API REST Unit Agregação Dimensões Grãos de tempo DS Exportação
Recurso Percentagem de utilização da memória da CPU

Porcentagem de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Recurso Percentagem de utilização da CPU

Porcentagem de utilização da CPU em uma instância. A utilização é relatada em intervalos de um minuto.
CpuUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Recurso Erros de coleta de dados por minuto

O número de eventos de coleta de dados caiu por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Médio instanceId, reason, type PT1M Não
Recurso Eventos de coleta de dados por minuto

O número de eventos de coleta de dados processados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Médio instanceId, type PT1M Não
Recurso Capacidade de implantação

O número de instâncias na implantação.
DeploymentCapacity Count Mínimo, Máximo, Médio instanceId, State PT1M Não
Recurso Utilização do disco

Porcentagem de utilização do disco em uma instância. A utilização é relatada em intervalos de um minuto.
DiskUtilization Percentagem Mínimo, Máximo, Médio instanceId, disk PT1M Sim
Recurso Energia da GPU em Joules

Energia de intervalo em Joules em um nó de GPU. A energia é reportada em intervalos de um minuto.
GpuEnergyJoules Count Mínimo, Máximo, Médio instanceId PT1M Não
Recurso Percentagem de utilização da memória GPU

Porcentagem de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Recurso Percentagem de utilização da GPU

Porcentagem de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuUtilizationPercentage Percentagem Mínimo, Máximo, Médio instanceId PT1M Sim
Trânsito Latência de solicitação P50

A latência média da solicitação P50 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P50 Milissegundos Média <nenhum> PT1M Sim
Trânsito Latência de solicitação P90

A latência média da solicitação P90 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P90 Milissegundos Média <nenhum> PT1M Sim
Trânsito Latência de solicitação P95

A latência média da solicitação P95 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P95 Milissegundos Média <nenhum> PT1M Sim
Trânsito Latência de solicitação P99

A latência média da solicitação P99 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado
RequestLatency_P99 Milissegundos Média <nenhum> PT1M Sim
Trânsito Pedidos por minuto

O número de solicitações enviadas para implantação on-line dentro de um minuto
RequestsPerMinute Count Média envoy_response_code PT1M Não