Limites de serviço para a Linguagem de IA do Azure
Observação
Este artigo descreve apenas os limites de recursos pré-configurados na Linguagem de IA do Azure: para ver os limites de serviços para recursos personalizáveis, confira os seguintes artigos:
Use este artigo para localizar os limites de tamanho e as tarifas para enviar dados para os seguintes recursos do serviço de linguagem.
- NER (Reconhecimento de Entidade Nomeada)
- Detecção de PIIs (informações de identificação pessoal)
- Extração de frases-chave
- Vinculação de entidade
- Análise de Texto para integridade
- Análise de Sentimento e a mineração de opiniões
- Detecção de idioma
Ao usar recursos do Serviço de linguagem, lembre-se das informações a seguir:
- Os preços são independentes dos limites de dados ou de taxas. O preço é baseado no número de registros de texto que você envia para a API, e está sujeito aos detalhes de preços dos seus recursos de Linguagem.
- Um registro de texto é medido como 1000 caracteres.
- Os limites de dados e taxa se baseiam no número de documentos que você envia para a API. Se você precisar analisar documentos maiores do que o limite permite, poderá dividir o texto em partes menores antes de enviá-los para a API.
- Um documento é uma cadeia de caracteres de texto.
Máximo de caracteres por documento
O limite a seguir especifica o número máximo de caracteres que podem estar em um único documento.
Recurso | Valor |
---|---|
Análise de Texto para integridade | 125.000 caracteres conforme medidos por StringInfo.LengthInTextElements. |
Todos os outros recursos pré-configurados (síncronos) | 5.120 caracteres conforme medido por StringInfo.LengthInTextElements. Se você precisar enviar documentos maiores, considere usar o recurso de forma assíncrona. |
Todos os outros recursos pré-configurados (assíncronos) | 125.000 caracteres em todos os documentos enviados, conforme medido por StringInfo.LengthInTextElements (máximo de 25 documentos). |
Se um documento exceder o limite de caracteres, a API se comportará de maneira diferente, a depender de como as solicitações são enviadas.
Se você estiver enviando solicitações de forma síncrona:
- A API não processa documentos que excedem o tamanho máximo e retorna um erro de documento inválido para cada um deles. Se uma solicitação de API tiver vários documentos, a API continuará a processá-los se estiverem dentro do limite de caracteres.
Se estiver enviando solicitações de forma assíncrona:
- A API rejeita toda a solicitação e retorna um erro
400 bad request
se qualquer documento dentro dela exceder o tamanho máximo.
Tamanho máximo de solicitação
O limite a seguir especifica o tamanho máximo dos documentos contidos em toda a solicitação.
Recurso | Valor |
---|---|
Todos os recursos pré-configurados | 1 MB |
Máximo de documentos por solicitação
Exceder os limites de documentos a seguir gera um código de erro HTTP 400.
Observação
Ao enviar solicitações de API assíncronas, você pode enviar no máximo 25 documentos por solicitação.
Recurso | Máximo de documentos por solicitação |
---|---|
Resumo de conversa | 1 |
Detecção de Idioma | 1000 |
Análise de Sentimento | 10 |
Mineração de opiniões | 10 |
Extração de Frases-Chave | 10 |
NER (Reconhecimento de Entidade Nomeada) | 5 |
Detecção de PII (informações de identificação pessoal) | 5 |
Resumo de documento | 25 |
Vinculação de Identidade | 5 |
Análise de Texto para integridade | 25 para a API baseada na Web, 1000 para o contêiner. (125.000 caracteres no total) |
Limites de taxa
O limite de taxa varia de acordo com o tipo de preço. Esses limites são os mesmos para as duas versões da API. Esses limites de taxa não se aplicam à Análise de Texto do contêiner de integridade, que não tem um limite de taxa definido.
Camada | Solicitações por segundo | Solicitações por minuto |
---|---|---|
S/Vários serviços | 1000 | 1000 |
S0/F0 | 100 | 300 |
As taxas de solicitações são calculadas separadamente para cada recurso. Você pode enviar o número máximo de solicitações do tipo de preço para cada recurso, ao mesmo tempo. Por exemplo, se você estiver na camada S
e enviar 1.000 solicitações de uma vez, não poderá enviar outra solicitação por 59 segundos.