Planejar e gerenciar custos de um serviço de Pesquisa de IA do Azure

Este artigo explica o modelo de cobrança e os eventos faturáveis do Azure AI Search e fornece orientação para gerenciar os custos.

Como primeiro passo, estime os custos da linha de base usando a calculadora de preços do Azure. Como alternativa, os custos estimados e as comparações de camadas também podem ser encontrados na página Selecione uma camada de preços ao criar um serviço.

O Azure fornece gerenciamento de custos interno que ultrapassa os limites do serviço para fornecer monitoramento de custos inclusivo e a capacidade de definir orçamentos e definir alertas. Os custos de execução de um serviço de pesquisa variam consoante a capacidade e as funcionalidades que utiliza. Depois de criar o seu serviço de pesquisa, otimize a capacidade para que pague apenas pelo que precisa.

Nota

As partições de maior capacidade estão disponíveis à mesma taxa de faturação em serviços mais recentes criados após abril e maio de 2024. Para obter mais informações, consulte Limites de serviço para atualizações de tamanho de partição.

Entenda o modelo de faturamento

O Azure AI Search é executado na infraestrutura do Azure que acumula custos quando você implanta novos recursos. É importante compreender que podem ser acumulados outros custos adicionais de infraestrutura.

Ao criar ou usar recursos de pesquisa, você será cobrado pelos seguintes medidores:

  • É-lhe cobrada uma taxa horária com base no nível de preços do seu serviço de pesquisa, proporcional à hora.

  • A taxa é aplicada de acordo com o número de unidades de pesquisa (SU) atribuídas ao serviço. As unidades de pesquisa são unidades de capacidade. Total SU é o produto de réplicas e partições (R x P = SU) utilizadas pelo seu serviço.

O faturamento é baseado na capacidade (SUs) e nos custos de execução de recursos premium, como enriquecimento de IA, classificação semântica e pontos de extremidade privados. Os medidores associados a recursos premium estão listados na tabela a seguir.

Metro Unit
Extração de imagens (enriquecimento IA) 1, 2 Por 1000 imagens. Veja a página de preços.
Habilidade de pesquisa de entidade personalizada (enriquecimento de IA) 1 Por 1000 registos de texto. Consulte a página de preços
Competências incorporadas (enriquecimento de IA) 1 Número de transações, cobradas na mesma taxa como se você tivesse executado a tarefa chamando os serviços de IA do Azure diretamente. Você pode processar 20 documentos por indexador por dia gratuitamente. Cargas de trabalho maiores ou mais frequentes exigem uma chave de serviços de IA do Azure com vários recursos.
Classificador semântico 1 Número de consultas de "queryType=semantic", cobradas a uma taxa progressiva. Veja a página de preços.
Link privado compartilhado 1 Cobrado pela largura de banda, desde que o link privado compartilhado exista e seja usado.

1 Aplica-se apenas se utilizar ou ativar a funcionalidade.

2 Em uma configuração de indexador, imageAction é o parâmetro que aciona a extração de imagem. Se imageAction estiver definido como "nenhum" (o padrão), você não será cobrado pela extração de imagem. Os custos são incorridos quando imageAction o parâmetro é definido e você inclui OCR, Análise de Imagem ou Extração de Documentos em um conjunto de habilidades.

Você não é cobrado pelo número de consultas vetoriais ou de texto completo, respostas a consultas ou documentos ingeridos, embora os limites de serviço se apliquem em cada camada.

O tráfego de dados também pode incorrer em custos de rede. Veja os Preços de largura de banda.

Vários recursos premium, como armazenamento de conhecimento, sessões de depuração e cache de enriquecimento, dependem do Armazenamento do Azure. Os medidores do Armazenamento do Azure se aplicam nesse caso, e os custos de armazenamento associados ao uso desses recursos são incluídos na fatura do Armazenamento do Azure.

As chaves gerenciadas pelo cliente fornecem criptografia dupla de conteúdo confidencial. Este recurso requer um Cofre de Chaves do Azure faturável).

Os conjuntos de habilidades podem incluir habilidades internas faturáveis, habilidades de serviços públicos internas não faturáveis e habilidades personalizadas. As habilidades de serviços públicos não faturáveis incluem Condicional, Shaper, Text Merge, Text Split. Você não será cobrado por usá-los. Não há nenhum requisito de chave de API e nenhum limite de 20 documentos.

Uma habilidade personalizada é a funcionalidade que você fornece. O custo de usar uma habilidade personalizada depende inteiramente se o código personalizado está chamando outros serviços faturáveis. Não há nenhum requisito de chave de API e nenhum limite de 20 documentos para habilidades personalizadas.

Monitorizar os custos

A gestão de custos está incorporada na infraestrutura do Azure. Consulte Faturamento e gerenciamento de custos para obter mais informações sobre como controlar custos, ferramentas e APIs.

Minimizar custos

Siga estas diretrizes para minimizar os custos de uma solução de Pesquisa de IA do Azure.

  1. Se possível, crie um serviço de pesquisa em uma região que tenha mais armazenamento por partição. Se você estiver usando vários recursos do Azure em sua solução, crie-os na mesma região ou no menor número possível de regiões para minimizar ou eliminar as cobranças de largura de banda.

  2. Aumente a escala para operações que consomem muitos recursos, como indexação, e reajuste para baixo para cargas de trabalho de consulta regulares. Se houver padrões previsíveis para suas cargas de trabalho, talvez seja possível sincronizar a escala para coincidir com o volume esperado (você precisaria escrever código para automatizar isso).

    Ao estimar o custo de uma solução de pesquisa, lembre-se de que o preço e a capacidade não são lineares (dobrar a capacidade mais do que dobra o custo no mesmo nível). Além disso, em algum momento, mudar para um nível mais alto pode lhe dar um desempenho melhor e mais rápido com aproximadamente o mesmo preço. Para obter mais informações e um exemplo, consulte Atualizar para uma camada S2 padrão.

  3. Considere o Aplicativo Web do Azure para seu aplicativo front-end para que as solicitações e respostas permaneçam dentro dos limites do data center.

  4. Se você estiver usando o enriquecimento de IA, há uma cobrança extra pelo armazenamento de blobs, mas o custo acumulado diminui se você habilitar o cache de enriquecimento.

Criar orçamentos

Pode criar orçamentos para gerir custos e criar alertas que notifiquem automaticamente as partes interessadas das anomalias nos gastos e do risco em fazer gastos excessivos. Os alertas são baseados nos gastos em comparação com os orçamentos e os limites de custos. Os orçamentos e alertas são criados para subscrições do Azure e grupos de recursos, pelo que são úteis como parte de uma estratégia geral de monitorização de custos.

Os orçamentos podem ser criados com filtros para recursos ou serviços específicos no Azure se você quiser mais granularidade presente em seu monitoramento. Os filtros ajudam a garantir que você não crie acidentalmente novos recursos que custam dinheiro extra. Para obter mais informações sobre as opções de filtro disponíveis quando você cria um orçamento, consulte Opções de grupo e filtro.

Exportar dados de custo

Também pode exportar os dados de custos para uma conta de armazenamento. Isso é útil quando você precisa ou outras pessoas para fazer mais análise de dados para custos. Por exemplo, uma equipe financeira pode analisar os dados usando o Excel ou o Power BI. Você pode exportar seus custos em uma programação diária, semanal ou mensal e definir um intervalo de datas personalizado. A exportação de dados de custo é a maneira recomendada de recuperar conjuntos de dados de custo.

FAQ

Posso encerrar temporariamente um serviço de pesquisa para poupar custos?

A pesquisa é executada como um serviço contínuo. Recursos dedicados estão sempre operacionais, alocados para seu uso exclusivo durante a vida útil do seu serviço. Para interromper totalmente a cobrança, você deve excluir o serviço. A exclusão de um serviço é permanente e também exclui seus dados associados.

Posso alterar a taxa de faturação (nível) de um serviço de pesquisa existente?

Não há suporte para upgrade ou downgrade in-loco. A alteração de uma camada de serviço requer o provisionamento de um novo serviço na camada desejada.

Próximos passos