Escolher uma camada de serviço para a IA do Azure Search

Parte da criação de um serviço de pesquisa é escolher um tipo de preço (ou SKU) corrigido para o tempo de vida do serviço. No portal, a camada é especificada na página Selecionar tipo de preço quando você cria o serviço. No PowerShell ou na CLI do Azure, a camada é especificada por meio do parâmetro -Sku.

O nível determina:

  • O número máximo de índices e outros objetos permitidos no serviço.
  • Tamanho e velocidade de partições (armazenamento físico)
  • A taxa faturável como custo mensal fixo, mas também um custo incremental se você adicionar capacidade.

Em algumas instâncias, a camada escolhida determina a disponibilidade dos recursos Premium.

As taxas de cobrança são mostradas na página Selecionar nível de preços do portal. Você pode verificar a página de preços para taxas regionais e revisar Planejar e gerenciar custos para saber mais sobre o modelo de cobrança.

Observação

Os serviços de pesquisa criados após 3 de abril de 2024 têm partições maiores e cotas de vetores mais altas em quase todas as camadas. Para saber mais, confira Limites do serviço.

Descrições de camada

As camadas são: Gratuito, Básico, Standard e Otimizado para Armazenamento. O Standard e Otimizado para Armazenamento estão disponíveis com várias configurações e capacidades. A captura de tela a seguir do portal do Azure mostra as camadas disponíveis, menos os preços (que você pode encontrar no portal e na página de preços).

Gráfico de tipo de preço

Gratuito cria um serviço de pesquisa limitado para projetos menores, como a execução de tutoriais e exemplos de código. Internamente, os recursos do sistema são compartilhados entre vários assinantes. Não é possível dimensionar um serviço gratuito, executar cargas de trabalho significativas e alguns recursos premium não estão disponíveis. Você pode ter um serviço de pesquisa gratuito por assinatura do Azure. Se o serviço estiver inativo por um longo período de tempo, ele poderá ser excluído para liberar a capacidade, especialmente se a região estiver sob restrições de capacidade.

Os níveis faturáveis mais comumente usados incluem:

  • Básico tem a capacidade de atender ao SLA com suporte para três réplicas.

  • Standard (S1, S2, S3) é o padrão. Isso oferece mais flexibilidade no dimensionamento das cargas de trabalho. Você pode escalar partições e réplicas. Com recursos dedicados sob seu controle, é possível implantar projetos maiores, otimizar o desempenho e aumentar a capacidade.

Algumas camadas são projetadas para determinados tipos de trabalho:

  • Standard 3 High Density (S3 HD) é um modo de hospedagem para S3, em que o hardware subjacente é otimizado para um grande número de índices menores e se destina a cenários de multilocação. O S3 HD tem o mesmo preço por unidade que S3, mas o hardware é otimizado para leituras rápidas de arquivos em um grande número de índices menores.

  • As camadas Otimizado para armazenamento (L1, L2) oferecem maior capacidade de armazenamento a um preço menor por TB do que as camadas Standard. Essas camadas são projetadas para índices grandes que não mudam com muita frequência. A principal vantagem é maior latência de consulta, que você deve validar para os requisitos de aplicativo específicos.

Saiba mais sobre as várias camadas na página de preços, no artigo Limites de serviço na IA do Azure Search, e na página do portal quando você estiver provisionando um serviço.

Disponibilidade da região por nível

A lista de regiões de com suporte fornece os locais em que a Pesquisa de IA do Azure é oferecido.

Atualmente, várias regiões estão em capacidade para os níveis específicas e não podem ser usadas para novos serviços de pesquisa. Se você usar o portal do Azure para criar um serviço de pesquisa, o portal excluirá quaisquer combinações de níveis de região que não estejam disponíveis.

Region Nível desabilitado (SKU) devido ao excesso de capacidade Alternativa sugerida
Índia Central S2, S3, S3HD, L1, L2 Sul da Índia
Leste dos EUA 2 Básico, S1 Centro dos EUA
Centro-Sul dos Estados Unidos Todas as camadas Centro dos EUA
US Gov – Virgínia Todas as camadas Governo dos EUA do Arizona
Europa Ocidental Todas as camadas Suécia Central/Norte da Europa
Oeste dos EUA 3 Básico, S1 Centro dos EUA

Disponibilidade de recursos por camada

A maioria dos recursos está disponível em todas as camadas, incluindo a camada gratuita. Em alguns casos, a camada determina a disponibilidade de um recurso. A tabela a seguir descreve as restrições.

Recurso Considerações sobre a camada de serviço
Indexadores Os indexadores não estão disponíveis no S3 HD. Os indexadores têm mais limitações na camada gratuita.
Parâmetro de configuraçãoexecutionEnvironment do indexador A capacidade de fixar todo o processamento do indexador apenas para os clusters de pesquisa alocados para seu serviço de pesquisa requer S2 e superior.
Enriquecimento de IA É executado na camada gratuita, mas não é recomendado.
Identidades gerenciadas ou confiáveis para acesso de saída (indexador) Não disponível na camada gratuita.
Chaves de criptografia gerenciadas pelo cliente Não disponível na camada gratuita.
Acesso de firewall de IP Não disponível na camada gratuita.
Ponto de extremidade privado (integração com o Link Privado do Azure) Para conexões de entrada para um serviço de pesquisa, não disponível na camada gratuita.
Para conexões de saída de indexadores com outros recursos do Azure, não disponível em Gratuito ou S3 HD.
Para indexadores que usam conjuntos de habilidades, não disponível em Gratuito, Básico, S1 ou S3 HD.
Zonas de Disponibilidade Não disponível na camada Gratuita ou Básica.
Classificador semântico Não disponível na camada gratuita.

Recursos com uso intensivo de funcionalidades podem não funcionar bem, a menos que você forneça capacidade suficiente. Por exemplo, o Enriquecimento de IA tem habilidades de longa execução que atingirão o tempo limite em um serviço Gratuito, a menos que o conjunto de dados seja pequeno.

Limites superiores

As camadas determinam o armazenamento máximo do próprio serviço, além do número máximo de índices, indexadores, fontes de dados, conjuntos de habilidades e mapas de sinônimos que você pode criar. Para obter uma interrupção completa de todos os limites, consulte Limites de serviço na IA do Azure Search.

Tamanho e velocidade da partição

O preço da camada inclui detalhes sobre o armazenamento por partição, que varia de 15 GB para camadas Básico a 2 TB para camadas Otimizadas para Armazenamento (L2). Outras características de hardware, como velocidade de operações, latência e taxas de transferência, não são publicadas, mas as camadas projetadas para arquiteturas de solução específicas são criadas em hardware que tem os recursos para dar suporte a esses cenários. Para obter mais informações sobre partições, consulte Estimar e gerenciar a capacidade e Confiabilidade na IA do Azure Search.

Observação

Partições de maior capacidade ficaram disponíveis em regiões selecionadas a partir de abril de 2024. Uma segunda onda de partições de maior capacidade lançada em maio de 2024. Se você estiver usando um serviço de pesquisa mais antigo, considere a criação de um novo serviço de pesquisa para se beneficiar de mais capacidade na mesma taxa de cobrança. Para saber mais, confira Limites do serviço. Para verificar a idade do serviço de pesquisa, consulte Como verificar a data de criação do serviço.

Taxas de cobrança

As camadas têm taxas de cobrança diferentes, com taxas mais altas para camadas que são executadas em hardware mais caro ou fornecem recursos mais caros. A taxa de cobrança da camada pode ser encontrada nas páginas de preços do Azure para a Pesquisa de IA do Azure.

Depois de criar um serviço, a taxa de cobrança torna-se um custo fixo de execução ininterrupta do serviço, e um custo incremental se você optar por adicionar mais capacidade.

Os serviços de pesquisa são recursos de computação alocados como partições (para armazenamento) e réplicas (instâncias do mecanismo de consulta). Inicialmente, um serviço é criado com um de cada, e a taxa de cobrança inclui os dois recursos. No entanto, se você dimensionar a capacidade, os custos aumentarão ou reduzirão em incrementos da taxa faturável.

O exemplo a seguir ilustra esse cenário. Imagine uma taxa de cobrança hipotética de US$ 100 por mês. Se você mantiver o serviço de pesquisa em sua capacidade inicial de uma partição e uma réplica, US$ 100 será o que você pode esperar pagar no final do mês. No entanto, se você adicionar mais duas réplicas para obter alta disponibilidade, a fatura mensal aumentará para US$ 300 (US$ 100 para o primeiro par de partição e réplica e US$ 200 para as duas réplicas).

Esse modelo de cobrança se baseia no conceito de aplicação da taxa de cobrança ao número de UAs (unidades de pesquisa) usadas por um serviço de pesquisa. Todos os serviços são inicialmente provisionados em uma UA, mas você pode aumentar o UAs adicionando partições ou réplicas para lidar com cargas de trabalho maiores. Para saber mais, confira Como estimar os custos de um serviço de pesquisa.

Atualização ou downgrade de camada

Não há suporte interno para atualizar ou fazer downgrade das camadas. Se você quiser mudar para uma camada diferente, a abordagem será:

  • Crie um novo serviço de pesquisa na nova camada.

  • Implante o conteúdo da sua pesquisa no novo serviço. Siga esta lista de verificação para verificar se você tem todo o conteúdo.

  • Exclua o antigo serviço de pesquisa quando tiver certeza de que ele não é mais necessário.

Nos índices grandes que você não quer recompilar do zero, considere usar a amostra de backup e restauração para movê-los.

Próximas etapas

A melhor maneira de escolher um tipo de preço é começar com uma camada de menor custo e, em seguida, fazer testes para tomar a decisão de manter o serviço ou criar outro em uma camada superior. Nas próximas etapas, é recomendável criar um serviço de pesquisa em uma camada acomode o nível de teste que você se propõe a fazer e, em seguida, examinar nas diretrizes a seguir as recomendações sobre como estimar o custo e a capacidade.