Cotas e limites de serviço

Artigo
09/26/2024

Este conteúdo se aplica a: v4.0 (versão prévia) | Versões anteriores:v3.1 (GA)v3.0 (GA)

Esse conteúdo se aplica a: v2.1 | ais recente: v4.0 (versão prévia)

Esse artigo contém uma referência rápida e uma descrição detalhada das cotas e dos limites do serviço de IA do Azure para Informação de Documentos para todos as camadas de preços. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Uso do modelo

Tipos de documento com suporte	Ler	Layout	Modelos predefinidos	Modelos personalizados	Funcionalidades de complemento
PDF	✔️	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = com suporte ✖️ = sem suporte

Tipos de documento com suporte	Ler	Layout	Modelos predefinidos	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = com suporte ✖️ = sem suporte

Cobrança

A cobrança da Informação de Documentos é calculada mensalmente com base no tipo de modelo e na quantidade de páginas analisadas. Você pode localizar as métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que a IA do Azure para Informação de Documentos processa. É possível verificar o custo estimado gasto no recurso usando a calculadora de preços do Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:

Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o parâmetro pages na solicitação. Quando o serviço analisa os documentos do Microsoft Excel e do PowerPoint por meio do modelo de leitura, OCR ou layout, ele conta cada planilha do Excel e slide do PowerPoint como uma página.
Quando o serviço analisa os arquivos PDF e TIFF, ele conta cada página do arquivo PDF ou cada imagem do arquivo TIFF como uma página sem limite máximo de caracteres.
Quando o serviço analisa arquivos do Microsoft Word e HTML com suporte dos modelos de leitura e layout, ele conta as páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contém 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres somam um total de três páginas.
Os modelos de leitura e layout não dão suporte à análise de imagens inseridas ou vinculadas em arquivos do Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as considera como imagens adicionadas.
O treinamento de um modelo personalizado é sempre gratuito com a Informação de Documentos. As cobranças serão aplicadas somente quando o serviço usar um modelo para analisar um documento.
O preço do contêiner é o mesmo que o preço do serviço de nuvem.
A Informação de Documentos oferece um nível gratuito (F0) em que é possível testar todos os recursos do serviço.
A Informação de Documentos tem um modelo de preços baseado em compromisso para cargas de trabalho grandes.
O modelo Layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados utilizado para o treinamento personalizado não tiver arquivos de rótulos disponíveis, o serviço os gerará para você e cobrará o uso do modelo de layout.

Quota	Gratuito (F0)¹	Standard (S0)
Limite de transações por segundo	1	15 (valor padrão)
Ajustável	Não	Sim ²
Tamanho máximo do documento	4 MB	500 MB
Ajustável	Não	Não
Número máximo de páginas (Análise)	2	2000
Ajustável	Não	Não
Tamanho máximo do arquivo de rótulos	10 MB	10 MB
Ajustável	Não	Não
Tamanho máximo da resposta json do OCR	500 MB	500 MB
Ajustável	Não	Não
Número máximo de modelos	500	5.000
Ajustável	Não	Não
Número máximo de modelos neurais	100	500
Ajustável	Não	Não

Uso do modelo personalizado

Quota	Gratuito (F0)¹	Standard (S0)
Limite do Modelo de Composição	5	500 (valor padrão)
Ajustável	Não	No
*Tamanho do conjunto de dados de treinamento Neural e Gerativo**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	No
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	No
*Número máximo de páginas (Treinamento) Neural e Gerativo**	50.000	50,000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 horas por mês ⁵	sem limite (pague por hora)
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1 GB	2GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Uso do modelo personalizado

Quota	Gratuito (F0)¹	Standard (S0)
Limite do Modelo de Composição	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	No
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural**	50.000	50,000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1 GB	1 GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Uso do modelo personalizado

Quota	Gratuito (F0)¹	Standard (S0)
Limite do Modelo de Composição	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	No
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural**	50.000	50,000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1 GB	1 GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Limites de modelo personalizado

Quota	Gratuito (F0)¹	Standard (S0)
Limite do Modelo de Composição	5	200 (valor padrão)
Ajustável	Não	Não
Tamanho do conjunto de dados de treinamento	50 MB	50 MB (valor padrão)
Ajustável	Não	Não
Número máximo de páginas (Treinamento)	500	500 (valor padrão)
Ajustável	Não	No

¹ Para o nível de preços Gratuito (F0), veja também os subsídios mensais na página de preços.
² Veja as melhores práticas, e instruções de ajuste.
³A contagem de treinamento dos modelos neural é zerada a cada mês. Abra uma solicitação de suporte para aumentar o limite mensal de treinamento.

⁴ Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de quaisquer atualizações relacionadas à rotulagem.

⁵ Esse limite se aplica apenas a v 4.0 (2024-07-31) modelos neural personalizados. A partir de v 4.0, oferecemos suporte ao treinamento de documentos maiores por períodos mais longos (até 10 horas gratuitas e incorrendo em cobranças posteriores). Para obter mais informações, consulte página de modelo neural personalizado.

Descrição detalhada, ajuste de cota e práticas recomendadas

Antes de solicitar um aumento de cota (quando aplicável), verifique se ele é necessário. O serviço de Informação de Documentos usa dimensionamento automático para trazer os recursos computacionais necessários on-demand, manter os custos baixos para o cliente e desprovisionar recursos não utilizados, evitando a manutenção de uma quantidade excessiva de capacidade de hardware.

Se seu aplicativo retornar o Código de Resposta 429 (Muitas solicitações) e sua carga de trabalho estiver dentro dos limites definidos, provavelmente, o serviço está escalando verticalmente para sua demanda, mas ainda não atingiu a escala necessária. Portanto, o serviço não tem de imediato os recursos suficientes para atender à solicitação. Esse estado é transitório e não deve durar pouco tempo.

Práticas recomendadas gerais para mitigar a limitação durante o dimensionamento automático

Para minimizar problemas relacionados à limitação (Código de Resposta 429), é recomendável o uso das seguintes técnicas:

Implemente a lógica de repetição no seu aplicativo
Evite alterações bruscas na carga de trabalho. Aumente a carga de trabalho gradualmente
Exemplo. O aplicativo está usando a Informação de Documentos e a carga de trabalho atual é 10 TPS (transações por segundo). No próximo segundo, você aumenta a carga para 40 TPS (ou seja, quatro vezes mais). O Serviço inicia imediatamente o dimensionamento para atender à nova carga, mas é provável que isso não seja possível dentro de um segundo. Portanto, algumas das solicitações recebem o Código de Resposta 429.

As seções a seguir descrevem casos específicos de ajuste de cotas. Avance para Informações de Documento: como aumentar o limite de solicitações simultâneas

Aumento do limite de solicitação de transações por segundo

Por padrão, o número de transações simultâneas por segundo é limitado a 15 transações por segundo para um recurso da Informação de Documentos. Para o tipo de preço Standard, esse valor pode sofrer aumento. Antes de enviar a solicitação, verifique se você já conhece o material nesta seção e está ciente das melhores práticas.

O aumento do limite de Solicitação Simultânea não afeta diretamente os custos. A Informação de Documentos usa o modelo "Pague apenas o que usar". O limite define até que ponto o Serviço pode ser escalado antes de começar a limitar as solicitações.

O valor existente do parâmetro de limite de Solicitação Simultânea não é visível por meio do portal do Azure, de ferramentas de linha de comando ou das solicitações de API. Para verificar o valor existente, crie uma Solicitação de Suporte do Azure.

Se quiser aumentar suas transações por segundo, você poderá habilitar o dimensionamento automático no recurso. Siga este documento para habilitar o dimensionamento automático em seu recurso: habilitar dimensionamento automático. Também é possível enviar uma solicitação de suporte de TPS.

Tenha as informações necessárias em mãos

ID do Recurso da Informação de Documentos
Region
Informações do modelo de base:
- Entre no Portal do Azure
- Selecione o recurso da Informação de Documentos para o qual deseja aumentar o limite de transação
- Selecione – Propriedades – (grupo de –Gerenciamento de Recursos–)
- Copie e salve os valores dos seguintes campos:
  - ID de Recurso
  - Localização (sua Região do ponto de extremidade)

Criar e enviar solicitação de suporte

Inicie o aumento do limite de transações por segundo (TPS) para seu recurso enviando a Solicitação de Suporte:

Não se esqueça de ter as informações necessárias
Entre no Portal do Azure
Selecione o recurso da Informação de Documentos para o qual deseja aumentar o limite de transação
Selecione –Nova solicitação de suporte– (grupo –Suporte + solução de problemas). Uma nova janela é exibida com as informações preenchidas automaticamente sobre sua assinatura do Azure e recurso do Azure
Insira – Resumo – (como "Aumentar o limite de TPS da Informação de Documentos")
Em Tipo de problema, selecione “Cota ou validação de uso”.
Selecione –Avançar: Soluções
Prossiga com a criação da solicitação
Insira as seguintes informações no campo – Descrição:
- uma observação: a solicitação é sobre a cota da Informação de Documentos.
- Forneça uma expectativa de TPS que você gostaria de dimensionar para atender.
- Informações de recursos do Azure que você coletou.
- Conclua a inserção das informações necessárias e selecione o botão – Criar – na guia – Revisar + criar
- Observe o número da solicitação de suporte nas notificações do portal do Azure. Procure suporte para entrar em contato com você em breve para processamento adicional.

Exemplo de uma melhor prática de padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos a seguir para mitigar a possível limitação de solicitação devido ao Dimensionamento automático em andamento. Ele não é uma receita exata, mas meramente um modelo que pode ser seguido e ajustado conforme necessário.

Vamos supor que um recurso da Informação de Documentos tem o limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se achar que está vendo uma limitação frequente com o código de resposta 429, comece implementando uma retirada exponencial na solicitação de resposta de análise GET. Usando um tempo de espera progressivamente maior entre as tentativas de respostas de erro consecutivas, por exemplo, um padrão de atrasos entre solicitações 2-5-13-34. Em geral, recomendamos não chamar a resposta de análise GET mais de uma vez a cada 2 segundos para uma solicitação POST correspondente.

Se achar que o número de solicitações POST está sendo restringido nos documentos que estão sendo enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um grau maior de processamento simultâneo, você precisa criar uma solicitação de suporte para aumentar os limites de serviço em transações por segundo.

Em geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de passar para a produção.

Próximas etapas

Saiba mais sobre códigos de erro e solução de problemas

Compartilhar via

Cotas e limites de serviço

Uso do modelo

Cobrança

Uso do modelo personalizado

Uso do modelo personalizado

Uso do modelo personalizado

Limites de modelo personalizado

Descrição detalhada, ajuste de cota e práticas recomendadas

Práticas recomendadas gerais para mitigar a limitação durante o dimensionamento automático

Aumento do limite de solicitação de transações por segundo

Tenha as informações necessárias em mãos

Criar e enviar solicitação de suporte

Exemplo de uma melhor prática de padrão de carga de trabalho

Próximas etapas

Comentários

Recursos adicionais