Limites de limitação de computação

Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes

A Computação da Microsoft implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e dar uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.

Como funcionam as políticas de limitação?

A Computação da Microsoft implementa as políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura por região por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:

  • Por limite de recursos – Cada recurso, como uma VM (máquina virtual), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite da VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.

  • Limite de assinatura – Além dos limites de recursos, há um limite geral no número de solicitações de API em todos os recursos dentro de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite de um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1.500 por minuto. Todas as solicitações de API de atualização de VM para a assinatura que excedam 1.500 serão limitadas.

Como a Computação da Microsoft determina os limites de limitação?

Para determinar os limites para cada recurso e assinatura, a Computação da Microsoft usa o Algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e contém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação em qualquer minuto.

No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens chegar a zero, as solicitações de API subsequentes serão limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Taxa de recarga de bucket para um recurso e uma assinatura.

Por exemplo: vamos considerar a "política de limitação da API de atualização de VM" que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma Capacidade máxima do bucket de 12 tokens. O usuário invoca a solicitação de API de atualização de VM para uma VM (máquina virtual) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Taxa de recarga de bucket. Portanto, quatro solicitações de API podem ser feitas no quinto minuto, enquanto a Computação da Microsoft limita uma solicitação de API devido a tokens insuficientes.

(min) Firewall
Número de tokens no início (A) 12 12 8 12 4 4
Solicitações por minuto (B) 0 8 0 13 5 0
Solicitações limitadas (C) 0 0 0 1 1 0
Tokens restantes no final do período
D = Max(A-B, 0)
12 4 8 0 0 4

Um processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a Taxa de recarga do bucket e a Capacidade máxima do bucket que é usada para determinar os limites de limitação de Máquinas virtuais, Conjuntos de Dimensionamento de Máquinas Virtuais e VMs do Conjunto de Dimensionamento de Máquinas Virtuais.

Limites de limitação para máquinas virtuais

As solicitações de API para Máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política APIs REST Nível do recurso Nível do recurso Nível de Assinatura Nível de Assinatura
Taxa de recarga do bucket (Por minuto) Capacidade máxima do bucket
(Por min)
Taxa de recarga do bucket
(Por min)
Capacidade máxima do bucket
(Por min)
Colocar VM
(Criar novas VMs)
Criar 4 12 500 1.500
Atualizar VM
(Atualizar VMs existentes)
Atualizar
Reaplicar Reiniciar
Desligar
Iniciar
Generalizar
Converter em discos gerenciados
Reimplantar
Executar manutenção
Captura
Executar Comando
Criar ou atualizar
Extensões – Atualizar
Extensões – Excluir
Recriação de imagem
Atualizar
Executar comandos – Atualizar
Executar Comandos – Excluir
Executar comandos – Criar ou atualizar
4 12 500 1.500
Excluir VM
(Excluir VMs)
Delete (excluir)
Simular remoção
Desalocar
4 12 500 1.500
Obter uma VM de baixo custo
(Obter informações sobre uma única VM)
Get
Exibição de instância
Extensões – Obter
Listar tamanhos disponíveis
Recuperar dados de diagnóstico de inicialização
Executar comandos – Obter por máquina virtual
Executar comandos – Listar por máquina virtual
12 36 8,000 24.000
Obter uma VM de alto custo1
(Obter informações sobre várias VMs)
Lista
Listar todos
Listar por localização
NA NA 300 900
Operação GET
(Obter informações sobre as operações assíncronas de VM)
Status de operações assíncronas 15 45 5\.000 15,000
Operações de patch de convidado da VM
(Avaliar e instalar patches de convidado)
Avaliar patches
Instalar patches
2 6 200 600

1 Somente as políticas de nível de assinatura são aplicáveis.

Limites de limitação para Conjuntos de Dimensionamento de Máquinas Virtuais

As solicitações de API para o Conjunto de Dimensionamento de Máquinas Virtuais (Uniform e Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniform. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política APIs REST Nível do recurso Nível do recurso Nível de Assinatura Nível de Assinatura
Taxa de recarga do bucket
(Por min)
Capacidade máxima do bucket
(Por min)
Taxa de recarga do bucket (Por minuto) Capacidade máxima do bucket
(Por min)
Colocar
(Criar novo conjunto de dimensionamento)
Criar 4 12 125 375
Atualizar
(Atualizar o conjunto de dimensionamento existente)
Atualizar
Iniciar2
Reiniciar2
Reimplantar2
Executar manutenção2
Refazer imagem2
Refazer todas as imagens2
Criar ou atualizar
Atualizações sem interrupção – Cancelar
Extensões – Criar
Extensões – Atualizar
Extensões – Excluir
Force Recovery Service Fabric Platform Update Domain Walk
Converter para grupo de canal único
Definir estado do serviço de orquestração
4 12 500 1.500
Excluir
(Excluir conjunto de dimensionamento)
Delete (excluir)
Desligar2
Desalocar
4 12 175 525
Obter baixo custo
(Obter informações sobre um único conjunto de dimensionamento)
Get
Listar SKUs
Atualizações sem interrupção – Obter as últimas
Obter o histórico de atualização do sistema operacional
12 36 800 2.400
Obter alto custo
(Obter informações de uso intensivo de recursos)
Obter exibição de instância
Listar2
Listar todos2
Listar por localização2
10 30 360 1.080

2 Somente as políticas de nível de assinatura são aplicáveis.

Limites de limitação para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais

As solicitações de API para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais são categorizadas em três políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:

Categoria de política APIs REST Nível do recurso Nível do recurso Nível de Assinatura Nível de Assinatura
Taxa de recarga do bucket
(Por min)
Capacidade máxima do bucket
(Por min)
Taxa de recarga do bucket
(Por min)
Capacidade máxima do bucket
(Por min)
Atualizar VMs do conjunto de dimensionamento
(Atualizar VMs existentes em um conjunto de dimensionamento)
Iniciar
Reiniciar
Recriação de imagem
ReimageAll
Atualizar
SimulateEviction
Extensões – Criar ou Atualizar
RunCommands – Criar ou Atualizar
RunCommands – Atualizar
4 12 500 1.500
Excluir VMs do conjunto de dimensionamento
(Excluir VMs do conjunto de dimensionamento)
Delete (excluir)
PowerOff
Desalocar
Extensões – Excluir
RunCommands – Excluir
4 12 500 1.500
Obter VMs do conjunto de dimensionamento
(Obter informações sobre VMs do conjunto de dimensionamento)
Get
Exibição GetInstance
Extensões – Obter
RunCommands – Excluir
Dados de diagnóstico RetrieveBoot
12 36 2\.000 6.000

Diretrizes de solução de problemas

Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte o tópico Solução de problemas de erros de limitação no Azure – Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e melhores práticas para evitar a limitação.

Perguntas Frequentes

Os usuários precisam executar alguma ação?

Os usuários não precisam alterar nada em suas cargas de trabalho ou configuração. Todas as APIs existentes continuam funcionando como estão.

Quais benefícios as políticas de limitação fornecem?

As políticas de limitação oferecem vários benefícios:

  • Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar chamadas à API com sucesso, 1 minuto depois da limitação.

  • Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.

  • A Computação da Microsoft está introduzindo um novo algoritmo, Algoritmo de bucket de token, para determinar os limites. O algoritmo fornece buffer extra para os clientes, ao mesmo tempo em que faz um grande número de solicitações de API.

O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?

Como parte de cada resposta, a Computação da Microsoft retorna x-ms-ratelimit-remaining-resource que pode ser usada para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicável é retornada como uma resposta aos Cabeçalhos informativos da taxa de chamadas.