Escalado automático de una instancia de Azure API Management

SE APLICA A: Básico | Estándar | Premium

Una instancia de servicio de Azure API Management puede escalarse de manera automática en función de un conjunto de reglas. Este comportamiento se puede habilitar y configurar mediante el escalado automático de Azure Monitor.

En este artículo se le guía por el proceso de configuración de escalado automático y sugiere una configuración óptima de las reglas de escalado automático.

Nota:

  • En los niveles de servicio que admitan varias unidades de escalado, también se puede escalar manualmente la instancia de API Management.
  • Un servicio API Management en el nivel Consumo se escala automáticamente en función del tráfico, sin necesidad de realizar ninguna configuración adicional.
  • Actualmente, no se admite la escalabilidad automática para la puerta de enlace del área de trabajo en las áreas de trabajo de API Management.

Requisitos previos

Para seguir los pasos de este artículo, debe:

Limitaciones de escalado automático de Azure API Management

Ciertas limitaciones y consecuencias de las decisiones de escalado deben tenerse en cuenta antes de configurar el comportamiento de escalado automático.

  • El plan de tarifa de la instancia de API Management determina el número máximo de unidades que resultará de aplicar el enfoque de escalabilidad. El nivel Estándar se puede escalar hasta un máximo de cuatro unidades. Puede agregar cualquier número de unidades en el nivel Premium.
  • El proceso de escalado tarda al menos 20 minutos.
  • Si el servicio se ve bloqueado por otra operación, la solicitud de escalabilidad producirá un error y volverá a intentarse automáticamente.
  • Si la instancia de servicio se implementa en varias regiones (ubicaciones), tan solo las unidades de la ubicación principal facilitarán la escalabilidad automática de Azure Monitor. Las unidades de otras ubicaciones solo facilitarán la escalabilidad manual.
  • Si la instancia de servicio se ha configurada con zonas de disponibilidad en la ubicación principal, tenga en cuenta el número de zonas al configurar la escalabilidad automática. El número de unidades de API Management en reglas y límites de escalabilidad automática debe ser un múltiplo del número de zonas.

Habilitar y configurar la escalabilidad automática para instancias de API Management

Siga estos pasos para configurar el escalado automático para un servicio Azure API Management:

  1. Inicie sesión en Azure Portal y vaya a la instancia de API Management.

  2. En el menú de la izquierda, seleccione Escalar horizontalmente (escalado automático) y, a continuación, seleccione Escalado automático personalizado.

    Captura de pantalla de las opciones de escalabilidad horizontal en el portal.

  3. En la condición de escala Predeterminada, seleccione Escalar según una métrica y, a continuación, seleccione Agregar una regla.

    Captura de pantalla de la configuración de la condición de escalado predeterminada en el portal.

  4. Defina una nueva regla de escalado horizontal.

    Por ejemplo, una regla de escalado horizontal podría desencadenar una adición de una unidad de API Management, cuando la métrica de capacidad promedio durante los últimos 30 minutos supere el 70 %. En la tabla siguiente se proporciona una configuración de ejemplo de dicha regla. Revise las limitaciones anteriores al definir una regla de escalado horizontal en el entorno.

    Parámetro Value Notas
    Origen de métricas Recurso actual Defina la regla según las métricas de recursos de API Management actuales.
    Criterios
    Nombre de métrica Capacity La métrica de capacidad es una métrica de API Management que refleja el uso de recursos de una instancia de Azure API Management.
    Location Seleccione la ubicación principal de la instancia de API Management
    Operator Mayor que
    Umbral de métrica 70% El umbral de la métrica de capacidad promedio. Para conocer las consideraciones sobre cómo establecer este umbral, consulte Uso de la capacidad para tomar decisiones de escalado.
    Duración (en minutos) 30 El intervalo de tiempo para promediar la métrica de capacidad es específica a los patrones de uso. Cuanto mayor sea la duración, más suave será la reacción. Los picos intermitentes tendrán menos efecto en la decisión de escalado horizontal. Sin embargo, también se demorará el desencadenador de escalado horizontal.
    Estadísticas de intervalo de agregación Average
    Acción
    Operación Aumentar recuento en
    Recuento de instancias 1 Escale la instancia de Azure API Management horizontalmente en 1 unidad.
    Tiempo de finalización (minutos) 60 El servicio de API Management tardará al menos 20 minutos en escalarse horizontalmente. En la mayoría de los casos, el período de finalización de 60 minutos evitará que se desencadenen muchos escalados horizontales.
  5. Seleccione Agregar para guardar la regla.

  6. Para agregar otra regla, seleccione Agregar una regla.

    Esta vez, deberá definirse una regla de reducción horizontal. Esto garantiza que no se malgasten los recursos cuando se reduce el uso de las API.

  7. Defina una nueva regla de reducción horizontal.

    Por ejemplo, una regla de reducción horizontal podría desencadenar una eliminación de una unidad de API Management cuando la métrica de capacidad promedio durante los últimos 30 minutos haya sido inferior al 35 %. En la tabla siguiente se proporciona una configuración de ejemplo de dicha regla.

    Parámetro Value Notas
    Origen de métricas Recurso actual Defina la regla según las métricas de recursos de API Management actuales.
    Criterios
    Agregación de tiempo Average
    Nombre de métrica Capacity La misma métrica que la utilizada para la regla de escalado horizontal.
    Location Seleccione la ubicación principal de la instancia de API Management
    Operator Menor que
    Umbral 35 % Al igual que con la regla de escalabilidad horizontal, este valor dependerá en gran medida de los patrones de uso de la instancia de API Management.
    Duración (en minutos) 30 El mismo valor que el utilizado para la regla de escalado horizontal.
    Estadísticas de intervalo de agregación Average
    Acción
    Operación Reducir el recuento en Lo opuesto a lo que se usó para la regla de escalado horizontal.
    Recuento de instancias 1 El mismo valor que el utilizado para la regla de escalado horizontal.
    Tiempo de finalización (minutos) 90 La reducción horizontal debería ser más conservadora que un escalado horizontal, por lo que el período de finalización debería ser mayor.
  8. Seleccione Agregar para guardar la regla.

  9. En Límites de instancia, seleccione el número mínimo, máximo y predeterminado de unidades de API Management.

    Nota

    API Management tiene un límite de unidades a las que puede escalar horizontalmente una instancia. El límite depende del nivel del servicio.

    Captura de pantalla que muestra cómo establecer límites de instancia en el portal.

  10. Seleccione Guardar. El escalado automático está configurado.