Dimensionamento controlado por eventos no Azure Functions
Nos planos Consumo, Consumo Flexível e Premium, o Azure Functions dimensiona recursos adicionando mais instâncias com base no número de eventos que acionam uma função.
Importante
O plano Flex Consumption está atualmente em pré-visualização.
A maneira como seu aplicativo de função é dimensionado depende do plano de hospedagem:
Plano de consumo: Cada instância do host Functions no plano de consumo é limitada, normalmente a 1,5 GB de memória e uma CPU. Uma instância do host suporta todo o aplicativo de função. Como tal, todas as funções dentro de um recurso de compartilhamento de aplicativo de função em uma instância são dimensionadas ao mesmo tempo. Quando os aplicativos de função compartilham o mesmo plano de consumo, eles ainda são dimensionados de forma independente.
Plano de consumo flexível: O plano usa uma estratégia determinística de dimensionamento por função, onde cada função é dimensionada independentemente, exceto para funções acionadas por HTTP, Blob e funções duráveis que são dimensionadas em seus próprios grupos. Para obter mais informações, consulte Dimensionamento por função. Essas instâncias são então dimensionadas com base na simultaneidade de suas solicitações.
Plano Premium: o tamanho específico do plano Premium determina a memória e a CPU disponíveis para todos os aplicativos desse plano nessa instância. O plano dimensiona suas instâncias com base nas necessidades de dimensionamento dos aplicativos no plano, e os aplicativos são dimensionados dentro do plano conforme necessário.
Os arquivos de código de função são armazenados em compartilhamentos de Arquivos do Azure na conta de armazenamento principal da função. Quando você exclui a conta de armazenamento principal do aplicativo de função, os arquivos de código de função são excluídos e não podem ser recuperados.
Dimensionamento de runtime
O Azure Functions usa um componente chamado controlador de escala para monitorar a taxa de eventos e determinar se a expansão deve ser dimensionada ou ampliada. O controlador de dimensionamento utiliza heurística para cada tipo de acionador. Por exemplo, quando você está usando um gatilho de armazenamento de fila do Azure, ele usa o dimensionamento baseado em destino.
A unidade de dimensionamento para as Funções do Azure é a aplicação de funções. Quando o aplicativo de função é expandido, mais recursos são alocados para executar várias instâncias do host do Azure Functions. Por outro lado, à medida que a procura de computação é reduzida, o controlador de dimensionamento remove as instâncias do anfitrião de funções. O número de instâncias é eventualmente "dimensionado" quando nenhuma função está sendo executada em um aplicativo de função.
Arranque a frio
Se seu aplicativo de função ficar ocioso por alguns minutos, a plataforma pode decidir dimensionar o número de instâncias nas quais seu aplicativo é executado para zero. A próxima solicitação tem a latência adicional de dimensionamento de zero para um. Esta latência é referida como arranque a frio. O número de dependências exigidas pelo seu aplicativo de função pode afetar o tempo de início a frio. O início a frio é mais um problema para operações síncronas, como gatilhos HTTP que devem retornar uma resposta. Se os arranques a frio estiverem a afetar as suas funções, considere utilizar um plano diferente do de Consumo. Os outros planos oferecem estas estratégias para mitigar ou eliminar arranques a frio:
Plano Premium: suporta instâncias pré-aquecidas e instâncias sempre prontas, com um mínimo de uma instância.
Plano Flex Consumption: suporta um número opcional de instâncias sempre prontas, que podem ser definidas com base no dimensionamento por instância.
Plano dedicado: o plano em si não é dimensionado dinamicamente, mas você pode executar seu aplicativo continuamente com a configuração Sempre ativado ativada.
Compreender comportamentos de dimensionamento
O dimensionamento pode variar com base em vários fatores, e os aplicativos são dimensionados de forma diferente com base nos gatilhos e no idioma selecionados. Existem algumas complexidades de comportamentos de dimensionamento a ter em conta:
- Instâncias máximas: um aplicativo de função única só é dimensionado para um máximo permitido pelo plano. No entanto, uma única instância pode processar mais de uma mensagem ou solicitação ao mesmo tempo. Você pode especificar um máximo mais baixo para a escala de aceleração, conforme necessário.
- Nova taxa de instância: para gatilhos HTTP, novas instâncias são alocadas, no máximo, uma vez por segundo. Relativamente a acionadores não HTTP, as instâncias novas serão alocadas uma vez a cada 30 segundos, no máximo. O dimensionamento é mais rápido se for executado num plano Premium .
- Dimensionamento baseado em destino: o dimensionamento baseado em destino fornece um modelo de dimensionamento rápido e intuitivo para clientes e atualmente é suportado para filas e tópicos do Service Bus, filas de armazenamento, Hubs de Eventos, Apache Kafka e extensões do Azure Cosmos DB. Certifique-se de revisar o dimensionamento baseado em destino para entender seu comportamento de dimensionamento.
- Dimensionamento por função: com algumas exceções notáveis, as funções executadas no plano Flex Consumption são dimensionadas em instâncias independentes. As exceções incluem gatilhos HTTP e gatilhos de armazenamento de Blob (Grade de Eventos). Cada um desses tipos de gatilho escala juntos como um grupo nas mesmas instâncias. Da mesma forma, todos os gatilhos de Funções Duráveis também compartilham instâncias e são dimensionados juntos. Para obter mais informações, consulte Dimensionamento por função.
- Máximo de gatilhos monitorados: Atualmente, o controlador de escala só pode monitorar até 100 gatilhos para tomar decisões de escala. Quando seu aplicativo tem mais de 100 gatilhos baseados em eventos, as decisões de dimensionamento são tomadas com base apenas nos primeiros 100 gatilhos executados. Para obter mais informações, consulte Práticas recomendadas e padrões para aplicativos escaláveis.
Limitar a expansão
Você pode decidir restringir o número máximo de instâncias que um aplicativo pode usar para expansão. Isso é mais comum para casos em que um componente a jusante, como um banco de dados, tem taxa de transferência limitada. Para obter os limites máximos de escala ao executar os vários planos de hospedagem, consulte Limites de escala.
Plano de consumo Flex
Por padrão, os aplicativos executados em um plano Flex Consumption têm limite de 100
instâncias gerais. Atualmente, o menor valor máximo de contagem de instâncias é 40
, e o maior valor de contagem máxima de instâncias suportado é 1000
. Ao usar o az functionapp create
comando para criar um aplicativo de função no plano Flex Consumption, use o --maximum-instance-count
parâmetro para definir essa contagem máxima de instâncias do seu aplicativo.
Observe que, embora você possa alterar a contagem máxima de instâncias de aplicativos Flex Consumption até 1000, seus aplicativos atingirão um limite de cota antes de atingir esse número. Consulte as cotas de memória de assinatura regional para obter mais detalhes.
Este exemplo cria um aplicativo com uma contagem máxima de instâncias de 200
:
az functionapp create --resource-group <RESOURCE_GROUP> --name <APP_NAME> --storage <STORAGE_ACCOUNT_NAME> --runtime <LANGUAGE_RUNTIME> --runtime-version <RUNTIME_VERSION> --flexconsumption-location <REGION> --maximum-instance-count 200
Este exemplo usa o az functionapp scale config set
comando para alterar a contagem máxima de instâncias de um aplicativo existente para 150
:
az functionapp scale config set --resource-group <RESOURCE_GROUP> --name <APP_NAME> --maximum-instance-count 150
Planos de Consumo/Premium
Em um plano Consumo ou Elastic Premium, você pode especificar um limite máximo inferior para seu aplicativo modificando o valor da definição de configuração do functionAppScaleLimit
site. O functionAppScaleLimit
pode ser definido como 0
ou null
para irrestrito, ou um valor válido entre 1
e o máximo do aplicativo.
az resource update --resource-type Microsoft.Web/sites -g <RESOURCE_GROUP> -n <FUNCTION_APP-NAME>/config/web --set properties.functionAppScaleLimit=<SCALE_LIMIT>
Comportamentos de scale-in
O dimensionamento controlado por eventos reduz automaticamente a capacidade quando a demanda por suas funções é reduzida. Ele faz isso drenando instâncias de suas execuções de função atuais e, em seguida, remove essas instâncias. Esse comportamento é registrado como modo de drenagem. O período de carência para funções que estão sendo executadas atualmente pode se estender por até 10 minutos para aplicativos do plano de consumo e até 60 minutos para aplicativos do plano Flex Consumption e Premium. O dimensionamento controlado por eventos e esse comportamento não se aplicam aos aplicativos de plano dedicado.
As seguintes considerações se aplicam a comportamentos de expansão:
- Para aplicativos executados no Windows em um plano de consumo, apenas aplicativos criados após maio de 2021 têm comportamentos de modo de drenagem habilitados por padrão.
- Para habilitar o desligamento normal para funções usando o gatilho do Service Bus, use a versão 4.2.0 ou uma versão posterior da Extensão do Service Bus.
Dimensionamento por função
Aplica-se apenas ao plano Flex Consumption (pré-visualização).
O plano Flex Consumption é único na medida em que implementa um comportamento de dimensionamento por função. No dimensionamento por função, exceto para gatilhos HTTP, Blob (Grade de Eventos) e Funções Duráveis, todos os outros tipos de gatilho de função em seu aplicativo são dimensionados em instâncias independentes. Todos os gatilhos HTTP em seu aplicativo são dimensionados como um grupo nas mesmas instâncias, assim como todos os gatilhos de Blob (Grade de Eventos) e todos os gatilhos de Funções Duráveis, que têm suas próprias instâncias compartilhadas.
Considere um aplicativo funcional hospedado em um plano Flex Consumption que tenha estas funções:
função1 | função2 | função3 | função4 | função5 | função6 | função7 |
---|---|---|---|---|---|---|
Acionador HTTP | Acionador HTTP | Gatilho de orquestração (durável) | Gatilho de atividade (durável) | Gatilho do Service Bus | Gatilho do Service Bus | Os Hubs de Eventos disparam |
Neste exemplo:
- As duas funções acionadas por HTTP (
function1
efunction2
) são executadas juntas em suas próprias instâncias e dimensionadas juntas de acordo com as configurações de simultaneidade HTTP. - As duas funções Durable (
function3
efunction4
) são executadas juntas em suas próprias instâncias e dimensionadas juntas com base em aceleradores de simultaneidade configurados. - A função
function5
acionada pelo Service Bus é executada por conta própria e dimensionada independentemente de acordo com as regras de dimensionamento baseadas em destino para filas e tópicos do Service Bus. - A função
function6
acionada pelo Service Bus é executada por conta própria e dimensionada independentemente de acordo com as regras de dimensionamento baseadas em destino para filas e tópicos do Service Bus. - O gatilho de Hubs de Eventos (
function7
) é executado em suas próprias instâncias e é dimensionado independentemente de acordo com as regras de dimensionamento baseadas em destino para Hubs de Eventos.
Práticas recomendadas e padrões para aplicativos escaláveis
Há muitos aspetos de um aplicativo de função que afetam a forma como ele é dimensionado, incluindo a configuração do host, o espaço ocupado pelo tempo de execução e a eficiência de recursos. Para obter mais informações, consulte a seção escalabilidade do artigo Considerações sobre desempenho. Você também deve estar ciente de como as conexões se comportam à medida que seu aplicativo de função é dimensionado. Para obter mais informações, consulte Como gerenciar conexões no Azure Functions.
Se o seu aplicativo tiver mais de 100 funções que usam gatilhos baseados em eventos, considere dividir o aplicativo em um ou mais aplicativos, onde cada aplicativo tem menos de 100 funções baseadas em eventos.
Para obter mais informações sobre dimensionamento em Python e Node.js, consulte Guia do desenvolvedor Python do Azure Functions - Dimensionamento e simultaneidade e Guia do desenvolvedor do Azure Functions Node.js - Dimensionamento e simultaneidade.
Próximos passos
Para saber mais, leia os artigos seguintes: