Capacidade de uma instância da Gestão de API do Azure

APLICA-SE A: Developer | Básico | Básico v2 | Padrão | Padrão v2 | Prémio

O Gerenciamento de API fornece métricas do Azure Monitor para detetar o uso da capacidade do sistema, ajudando você a solucionar problemas de gateway e tomar decisões informadas sobre dimensionar ou atualizar uma instância de Gerenciamento de API para acomodar mais carga.

Este artigo explica as métricas de capacidade e como elas se comportam, mostra como acessar as métricas de capacidade no portal do Azure e sugere quando considerar dimensionar ou atualizar sua instância de Gerenciamento de API.

Nota

Atualmente, esse recurso não está disponível em espaços de trabalho.

Importante

Este artigo apresenta como monitorar e dimensionar sua instância de Gerenciamento de API do Azure com base em métricas de capacidade. No entanto, quando uma instância atinge sua capacidade, ela não é acelerada para evitar sobrecarga. Em vez disso, ele agirá como um servidor Web sobrecarregado: latência aumentada, conexões interrompidas e erros de tempo limite. Os clientes de API devem estar prontos para lidar com esses problemas como fazem com outros serviços externos, por exemplo, usando políticas de repetição.

Pré-requisitos

Para seguir as etapas neste artigo, você deve ter uma instância de Gerenciamento de API em uma das camadas que ofereça suporte a métricas de capacidade. Para obter mais informações, consulte Criar uma instância de Gerenciamento de API do Azure.

Métricas de capacidade disponíveis

Diferentes métricas de capacidade estão disponíveis nas camadas de serviço v2 e clássicas.

Nas camadas v2, as seguintes métricas estão disponíveis:

  • Porcentagem de CPU do gateway - A porcentagem de capacidade da CPU usada pelas unidades de gateway.

  • Porcentagem de memória do gateway - A porcentagem da capacidade de memória usada pelas unidades de gateway.

As agregações disponíveis para essas métricas são as seguintes.

  • Média - Porcentagem média de capacidade usada nos processos de gateway em cada unidade de uma instância de Gerenciamento de API.
  • Max - Percentagem de capacidade no processo de gateway com maior consumo.

A utilização da CPU e da memória apresenta o consumo de recursos por:

  • Serviços do plano de dados da Gestão de API, como processamento de pedidos, que podem incluir o reencaminhamento de pedidos ou a execução de uma política.
  • Serviços de plano de gerenciamento de Gerenciamento de API, como ações de gerenciamento aplicadas por meio do portal do Azure ou do Gerenciador de Recursos do Azure, ou carga proveniente do portal do desenvolvedor.
  • Determinados processos do sistema operativo, incluindo processos que envolvem custos de handshakes TLS em novas ligações.
  • Atualizações da plataforma, tais como atualizações do SO nos recursos de computação subjacentes da instância.
  • Número de APIs implantadas, independentemente da atividade, que podem consumir capacidade adicional.

Comportamento da métrica de capacidade

Na vida real, as métricas de capacidade podem ser afetadas por muitas variáveis, por exemplo:

  • padrões de conexão (nova conexão em uma solicitação versus reutilização da conexão existente)
  • Tamanho de uma solicitação e resposta
  • políticas configuradas em cada API ou número de clientes que enviam solicitações.

Quanto mais complexas forem as operações nas solicitações, maior será o consumo de capacidade. Por exemplo, políticas de transformação complexas consomem muito mais CPU do que um simples encaminhamento de solicitação. Respostas lentas do serviço de back-end também aumentam isso.

Importante

As métricas de capacidade não são medidas diretas do número de solicitações que estão sendo processadas.

Picos métricos de capacidade

As métricas de capacidade também podem aumentar intermitentemente ou ser maiores que zero, mesmo que nenhuma solicitação esteja sendo processada. Isso acontece por causa de ações específicas do sistema ou da plataforma e não deve ser levado em consideração ao decidir se deve dimensionar uma instância.

Embora as métricas de capacidade sejam projetadas para revelar problemas com sua instância de Gerenciamento de API, há casos em que os problemas não serão refletidos em alterações nessas métricas. Além disso, as métricas de baixa capacidade não significam necessariamente que sua instância de Gerenciamento de API não esteja enfrentando problemas.

Usar o portal do Azure para examinar métricas de capacidade

Acesse métricas no portal para entender quanta capacidade é usada ao longo do tempo.

  1. Navegue até sua instância de Gerenciamento de API no portal do Azure.
  2. No menu à esquerda, em Monitoramento, selecione Métricas.
  3. Selecione a métrica Porcentagem de CPU do gateway ou Porcentagem de memória do gateway nas métricas disponíveis. Escolha a agregação média padrão ou selecione a agregação máxima para ver o pico de uso.
  4. Escolha um período de tempo desejado na barra superior da seção.

Importante

Atualmente, a métrica Capacidade também aparece no portal para instâncias em camadas v2. No entanto, ele não é suportado para uso nas camadas v2 e mostra um valor de 0.

Nota

Você pode definir um alerta de métrica para informar quando algo inesperado está acontecendo. Por exemplo, receba notificações quando sua instância de Gerenciamento de API tiver excedido o pico esperado de uso de CPU ou memória por mais de 20 minutos.

Utilizar a capacidade para decisões de dimensionamento

Use métricas de capacidade para tomar decisões sobre o dimensionamento de uma instância de Gerenciamento de API para acomodar mais carga. As considerações gerais são as seguintes:

  • Olhe para uma tendência e média de longo prazo.
  • Ignore picos repentinos que provavelmente não estão relacionados a um aumento na carga (consulte a seção Comportamento da métrica de capacidade para obter explicações).
  • Como regra geral, atualize ou dimensione sua instância quando um valor de métrica de capacidade exceder 60% - 70% por um longo período de tempo (por exemplo, 30 minutos). Valores diferentes podem funcionar melhor para o seu serviço ou cenário.
  • Se sua instância estiver configurada com apenas 1 unidade, atualize ou dimensione sua instância quando um valor de métrica de capacidade exceder 40% por um longo período. Esta recomendação baseia-se na necessidade de reservar capacidade para atualizações do SO convidado na plataforma de serviço subjacente.

Gorjeta

Se você puder estimar seu tráfego com antecedência, teste sua instância de Gerenciamento de API nas cargas de trabalho esperadas. Você pode aumentar a carga de solicitação em seu locatário gradualmente e monitorar o valor da métrica de capacidade que corresponde à sua carga de pico. Siga as etapas da seção anterior para usar o portal do Azure para entender quanta capacidade é usada em determinado momento.