Limites de limitação de computação

Artigo
10/15/2024

Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes

A Computação da Microsoft implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e dar uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.

Como funcionam as políticas de limitação?

A Computação da Microsoft implementa as políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura por região por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:

Por limite de recursos – Cada recurso, como uma VM (máquina virtual), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite da VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.
Limite de assinatura – Além dos limites de recursos, há um limite geral no número de solicitações de API em todos os recursos dentro de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite de um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1.500 por minuto. Todas as solicitações de API de atualização de VM para a assinatura que excedam 1.500 serão limitadas.

Como a Computação da Microsoft determina os limites de limitação?

Para determinar os limites para cada recurso e assinatura, a Computação da Microsoft usa o Algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e contém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação em qualquer minuto.

No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens chegar a zero, as solicitações de API subsequentes serão limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Taxa de recarga de bucket para um recurso e uma assinatura.

Por exemplo: vamos considerar a "política de limitação da API de atualização de VM" que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma Capacidade máxima do bucket de 12 tokens. O usuário invoca a solicitação de API de atualização de VM para uma VM (máquina virtual) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Taxa de recarga de bucket. Portanto, quatro solicitações de API podem ser feitas no quinto minuto, enquanto a Computação da Microsoft limita uma solicitação de API devido a tokens insuficientes.

(min)	1º	2º	Firewall	4º	5º	6º
Número de tokens no início (A)	12	12	8	12	4	4
Solicitações por minuto (B)	0	8	0	13	5	0
Solicitações limitadas (C)	0	0	0	1	1	0
Tokens restantes no final do período D = Max(A-B, 0)	12	4	8	0	0	4

Um processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a Taxa de recarga do bucket e a Capacidade máxima do bucket que é usada para determinar os limites de limitação de Máquinas virtuais, Conjuntos de Dimensionamento de Máquinas Virtuais e VMs do Conjunto de Dimensionamento de Máquinas Virtuais.

Limites de limitação para máquinas virtuais

As solicitações de API para Máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política	APIs REST	Nível do recurso	Nível do recurso	Nível de Assinatura	Nível de Assinatura
		Taxa de recarga do bucket (Por minuto)	Capacidade máxima do bucket (Por min)	Taxa de recarga do bucket (Por min)	Capacidade máxima do bucket (Por min)
Colocar VM (Criar novas VMs)	Criar	4	12	500	1.500
Atualizar VM (Atualizar VMs existentes)	Atualizar Reaplicar Reiniciar Desligar Iniciar Generalizar Converter em discos gerenciados Reimplantar Executar manutenção Captura Executar Comando Criar ou atualizar Extensões – Atualizar Extensões – Excluir Recriação de imagem Atualizar Executar comandos – Atualizar Executar Comandos – Excluir Executar comandos – Criar ou atualizar	4	12	500	1.500
Excluir VM (Excluir VMs)	Delete (excluir) Simular remoção Desalocar	4	12	500	1.500
Obter uma VM de baixo custo (Obter informações sobre uma única VM)	Get Exibição de instância Extensões – Obter Listar tamanhos disponíveis Recuperar dados de diagnóstico de inicialização Executar comandos – Obter por máquina virtual Executar comandos – Listar por máquina virtual	12	36	8,000	24.000
Obter uma VM de alto custo¹ (Obter informações sobre várias VMs)	Lista Listar todos Listar por localização	NA	NA	300	900
Operação GET (Obter informações sobre as operações assíncronas de VM)	Status de operações assíncronas	15	45	5\.000	15,000
Operações de patch de convidado da VM (Avaliar e instalar patches de convidado)	Avaliar patches Instalar patches	2	6	200	600

¹ Somente as políticas de nível de assinatura são aplicáveis.

Limites de limitação para Conjuntos de Dimensionamento de Máquinas Virtuais

As solicitações de API para o Conjunto de Dimensionamento de Máquinas Virtuais (Uniform e Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniform. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política	APIs REST	Nível do recurso	Nível do recurso	Nível de Assinatura	Nível de Assinatura
		Taxa de recarga do bucket (Por min)	Capacidade máxima do bucket (Por min)	Taxa de recarga do bucket (Por minuto)	Capacidade máxima do bucket (Por min)
Colocar (Criar novo conjunto de dimensionamento)	Criar	4	12	125	375
Atualizar (Atualizar o conjunto de dimensionamento existente)	Atualizar Iniciar² Reiniciar² Reimplantar² Executar manutenção² Refazer imagem² Refazer todas as imagens² Criar ou atualizar Atualizações sem interrupção – Cancelar Extensões – Criar Extensões – Atualizar Extensões – Excluir Force Recovery Service Fabric Platform Update Domain Walk Converter para grupo de canal único Definir estado do serviço de orquestração	4	12	500	1.500
Excluir (Excluir conjunto de dimensionamento)	Delete (excluir) Desligar² Desalocar	4	12	175	525
Obter baixo custo (Obter informações sobre um único conjunto de dimensionamento)	Get Listar SKUs Atualizações sem interrupção – Obter as últimas Obter o histórico de atualização do sistema operacional	12	36	800	2.400
Obter alto custo (Obter informações de uso intensivo de recursos)	Obter exibição de instância Listar² Listar todos² Listar por localização²	10	30	360	1.080

² Somente as políticas de nível de assinatura são aplicáveis.

Limites de limitação para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais

As solicitações de API para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais são categorizadas em três políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política	APIs REST	Nível do recurso	Nível do recurso	Nível de Assinatura	Nível de Assinatura
		Taxa de recarga do bucket (Por min)	Capacidade máxima do bucket (Por min)	Taxa de recarga do bucket (Por min)	Capacidade máxima do bucket (Por min)
Atualizar VMs do conjunto de dimensionamento (Atualizar VMs existentes em um conjunto de dimensionamento)	Iniciar Reiniciar Recriação de imagem ReimageAll Atualizar SimulateEviction Extensões – Criar ou Atualizar RunCommands – Criar ou Atualizar RunCommands – Atualizar	4	12	500	1.500
Excluir VMs do conjunto de dimensionamento (Excluir VMs do conjunto de dimensionamento)	Delete (excluir) PowerOff Desalocar Extensões – Excluir RunCommands – Excluir	4	12	500	1.500
Obter VMs do conjunto de dimensionamento (Obter informações sobre VMs do conjunto de dimensionamento)	Get Exibição GetInstance Extensões – Obter RunCommands – Excluir Dados de diagnóstico RetrieveBoot	12	36	2\.000	6.000

Diretrizes de solução de problemas

Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte o tópico Solução de problemas de erros de limitação no Azure – Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e melhores práticas para evitar a limitação.

Perguntas Frequentes

Os usuários precisam executar alguma ação?

Os usuários não precisam alterar nada em suas cargas de trabalho ou configuração. Todas as APIs existentes continuam funcionando como estão.

Quais benefícios as políticas de limitação fornecem?

As políticas de limitação oferecem vários benefícios:

Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar chamadas à API com sucesso, 1 minuto depois da limitação.
Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.
A Computação da Microsoft está introduzindo um novo algoritmo, Algoritmo de bucket de token, para determinar os limites. O algoritmo fornece buffer extra para os clientes, ao mesmo tempo em que faz um grande número de solicitações de API.

O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?

Como parte de cada resposta, a Computação da Microsoft retorna x-ms-ratelimit-remaining-resource que pode ser usada para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicável é retornada como uma resposta aos Cabeçalhos informativos da taxa de chamadas.

Compartilhar via