Escalado de Application Gateway v2 y WAF v2
Application Gateway and WAF pueden configurarse para escalarse de dos maneras:
- Escalado automático: con el escalado automático habilitado, las SKU v2 de Application Gateway y WAF se escalan o reducen horizontalmente en función de los requisitos del tráfico de la aplicación. Este modo ofrece una mayor elasticidad a su aplicación y elimina la necesidad de adivinar el tamaño de la puerta de enlace de aplicaciones o el número de instancias. Este modo también le permite ahorrar costos al no requerir que se ejecute la puerta de enlace a una capacidad máxima de aprovisionamiento para una carga de tráfico máxima prevista. Debe especificar un número de instancias mínimo y opcionalmente máximo. La capacidad mínima garantiza que Application Gateway y WAF v2 no caigan por debajo del número mínimo de instancias especificado, incluso sin tráfico. Cada instancia es aproximadamente equivalente a 10 unidades de capacidad reservada adicionales. Cero significa que no hay capacidad reservada y es por naturaleza estrictamente de escalado automático. Opcionalmente, también puede especificar un número máximo de instancias, lo que garantiza que Application Gateway no se amplíe más allá del número de instancias especificado. Solo se le factura la cantidad de tráfico que proporciona la puerta de enlace. Los números de instancias pueden oscilar entre 0 y 125. El valor predeterminado para el número máximo de instancias es 10 si no se especifica.
Nota:
Si el recuento de instancias máximo se actualiza a un valor menor que el recuento de instancias actual, la nueva configuración no surtirá efecto inmediato. El máximo recién actualizado solo se aplicará después de que una operación de reducción horizontal lleve el recuento actual por debajo del número máximo recién actualizado. Si no se produce la operación de reducción horizontal porque no se cumplen los umbrales de reducción horizontal del escalado automático, no se aplicará la nueva configuración máxima.
- manual : también puede elegir el modo manual en el que la puerta de enlace no se escala automáticamente. En este modo, si hay más tráfico del que puede asumir Application Gateway o WAF, podría perderse tráfico. Con el modo manual, es obligatorio especificar el número de instancias. El número de instancias puede variar de 1 a 125 instancias.
Nota:
Estos modos de escalado no se aplican a Application Gateway Basic. Application Gateway Basic escala verticalmente automáticamente hasta un estimado de 200 conexiones por segundo, en función de un certificado TLS de clave RSA de 2048 bits.
Escalado automático y alta disponibilidad
Las instancias de Azure Application Gateway siempre se implementan para ofrecer alta disponibilidad. El servicio se compone de varias instancias que se crean como configuradas si el escalado automático está deshabilitado o la carga de la aplicación requiere el escalado automático si está habilitado el escalado automático. Desde la perspectiva del usuario, no necesariamente tiene visibilidad sobre las instancias individuales, sino solo en el servicio Application Gateway en su conjunto. Si una instancia determinada tiene un problema y deja de funcionar, Azure Application Gateway crea de forma transparente una nueva instancia.
Incluso si configura el escalado automático con cero instancias mínimas, el servicio sigue siendo de alta disponibilidad, que siempre se incluye con el precio fijo.
Sin embargo, es importante tener en cuenta que el aprovisionamiento de una nueva instancia puede tardar aproximadamente seis a siete minutos. Comprender el comportamiento de escalado de las instancias de Application Gateway es clave para mantener el rendimiento bajo cargas variables. Estas instancias se escalan horizontalmente en grupos, y el tamaño del grupo se incrementa proactivamente cuando el recuento de instancias actual es mayor. Esta estrategia permite al sistema administrar eficazmente los picos de carga de trabajo, evitando posibles interrupciones o ralentizaciones del servicio. Cada instancia de Azure Application Gateway puede controlar hasta 10 unidades de capacidad. Para optimizar su configuración de escalado automático, tenga en cuenta sus patrones de tráfico típicos y establezca las instancias mínimas en consecuencia para garantizar una operación sin problemas.
En el caso de los eventos de escalado horizontal, Application Gateway purga las conexiones existentes durante 5 minutos en la instancia que está sujeta para su eliminación. Después de 5 minutos, se cierran las conexiones existentes y se quita la instancia. Cualquier nueva conexión durante o después del tiempo de escalado de 5 minutos se establece en otras instancias existentes en la misma puerta de enlace.