Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Cabeçalhos de tabela
Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - Nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de grãos de - tempo em que a métrica é amostrada. Por exemplo, PT1M
indica que a métrica é amostrada a cada minuto, PT30M
a cada 30 minutos, PT1H
a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.
Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.
Categoria | Metric | Nome na API REST | Unit | Agregação | Dimensões | Grãos de tempo | DS Exportação |
---|---|---|---|---|---|---|---|
Recurso | Percentagem de utilização da memória da CPU Porcentagem de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Recurso | Percentagem de utilização da CPU Porcentagem de utilização da CPU em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Recurso | Erros de coleta de dados por minuto O número de eventos de coleta de dados caiu por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Médio | instanceId , reason , type |
PT1M | Não |
Recurso | Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Médio | instanceId , type |
PT1M | Não |
Recurso | Capacidade de implantação O número de instâncias na implantação. |
DeploymentCapacity |
Count | Mínimo, Máximo, Médio | instanceId , State |
PT1M | Não |
Recurso | Utilização do disco Porcentagem de utilização do disco em uma instância. A utilização é relatada em intervalos de um minuto. |
DiskUtilization |
Percentagem | Mínimo, Máximo, Médio | instanceId , disk |
PT1M | Sim |
Recurso | Energia da GPU em Joules Energia de intervalo em Joules em um nó de GPU. A energia é reportada em intervalos de um minuto. |
GpuEnergyJoules |
Count | Mínimo, Máximo, Médio | instanceId |
PT1M | Não |
Recurso | Percentagem de utilização da memória GPU Porcentagem de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Recurso | Percentagem de utilização da GPU Porcentagem de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Trânsito | Latência de solicitação P50 A latência média da solicitação P50 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P50 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Trânsito | Latência de solicitação P90 A latência média da solicitação P90 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P90 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Trânsito | Latência de solicitação P95 A latência média da solicitação P95 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P95 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Trânsito | Latência de solicitação P99 A latência média da solicitação P99 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P99 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
Trânsito | Pedidos por minuto O número de solicitações enviadas para implantação on-line dentro de um minuto |
RequestsPerMinute |
Count | Média | envoy_response_code |
PT1M | Não |