Dimensionamento do Application Gateway v2 e WAF v2
O Application Gateway e o WAF podem ser configurados para serem dimensionados em dois modos:
- Dimensionamento automático - Com o dimensionamento automático habilitado, as SKUs do Application Gateway e do WAF v2 são dimensionadas ou ampliadas com base nos requisitos de tráfego do aplicativo. Esse modo oferece melhor elasticidade ao seu aplicativo e elimina a necessidade de adivinhar o tamanho do gateway de aplicativo ou a contagem de instâncias. Esse modo também permite economizar custos ao não exigir que o gateway seja executado na capacidade provisionada de pico para a carga máxima de tráfego esperada. Você deve especificar uma contagem de instâncias mínima e, opcionalmente, máxima. A capacidade mínima garante que o Application Gateway e o WAF v2 não fiquem abaixo da contagem mínima de instâncias especificada, mesmo sem tráfego. Cada instância é aproximadamente equivalente a mais 10 Unidades de Capacidade reservadas. Zero significa que não há capacidade reservada e é puramente autoscaling por natureza. Opcionalmente, você também pode especificar uma contagem máxima de instâncias, o que garante que o Application Gateway não seja dimensionado além do número especificado de instâncias. Você será cobrado apenas pela quantidade de tráfego servido pelo Gateway. As contagens de instâncias podem variar de 0 a 125. O valor padrão para contagem máxima de instâncias é 10 se não for especificado.
Nota
Se a contagem máxima de instâncias for atualizada para um valor menor do que a contagem de instâncias atual, a nova configuração não terá efeito imediato. O máximo recentemente atualizado só será aplicado depois que uma operação de escalonamento colocar a contagem atual abaixo da contagem máxima recém-atualizada. Se a operação de dimensionamento não ocorrer porque a escala de dimensionamento automático nos limites não for atendida, a nova configuração máxima não será aplicada.
- Manual - Você também pode escolher o modo Manual em que o gateway não é dimensionado automaticamente. Nesse modo, se houver mais tráfego do que o Application Gateway ou WAF pode lidar, isso pode resultar em perda de tráfego. Com o modo manual, a especificação da contagem de instâncias é obrigatória. A contagem de instâncias pode variar de 1 a 125 instâncias.
Nota
Esses modos de dimensionamento não se aplicam ao Application Gateway Basic. O Application Gateway Basic pode ser dimensionado automaticamente até cerca de 200 conexões por segundo, com base em um certificado TLS de chave RSA de 2048 bits.
Dimensionamento automático e alta disponibilidade
Os Gateways de Aplicativo do Azure são sempre implantados de forma altamente disponível. O serviço é composto por várias instâncias que são criadas como configuradas se o dimensionamento automático estiver desabilitado ou exigidas pela carga do aplicativo se o dimensionamento automático estiver habilitado. Da perspetiva do usuário, você não tem necessariamente visibilidade das instâncias individuais, mas apenas do serviço Application Gateway como um todo. Se uma determinada instância tiver um problema e deixar de ser funcional, o Gateway de Aplicativo do Azure criará uma nova instância de forma transparente.
Mesmo que você configure o dimensionamento automático com instâncias mínimas zero, o serviço ainda estará altamente disponível, o que sempre será incluído com o preço fixo.
No entanto, é importante observar que o provisionamento de uma nova instância pode levar aproximadamente seis a sete minutos. Compreender o comportamento de dimensionamento das instâncias do Application Gateway é fundamental para manter o desempenho sob cargas variáveis. Essas instâncias são dimensionadas em grupos, e o tamanho do grupo é aumentado proativamente quando a contagem de instâncias atual é maior. Essa estratégia permite que o sistema gerencie picos de carga de trabalho de forma eficiente, evitando possíveis interrupções ou lentidão do serviço. Cada instância do Gateway de Aplicativo do Azure pode lidar com até 10 Unidades de Capacidade. Para otimizar suas configurações de dimensionamento automático, considere seus padrões de tráfego típicos e defina as instâncias mínimas de acordo para garantir uma operação suave.
Para eventos de expansão, o Application Gateway drena as conexões existentes por 5 minutos na instância sujeita à remoção. Após 5 minutos, as conexões existentes são fechadas e a instância removida. Quaisquer novas conexões durante ou após o tempo de escala de 5 minutos são estabelecidas para outras instâncias existentes no mesmo gateway.