Límites de servicio en Azure AI Search

Los límites máximos sobre el almacenamiento, las cargas de trabajo, las cantidades de índices y otros objetos dependen de si se crea Azure AI Search conforme a un plan de tarifa Gratis, Básico, Estándar u Optimizado para almacenamiento.

  • Gratis es un servicio multiinquilino compartido incluido en su suscripción de Azure.

  • Básico proporciona recursos informáticos dedicados para cargas de trabajo de producción en una escala menor, pero comparte algunas infraestructuras de red con otros inquilinos.

  • Estándar se ejecuta en máquinas dedicadas, con más almacenamiento y capacidad de procesamiento en cada nivel. Estándar incluye cuatro niveles: S1, S2, S3 y S3 HD. S3 High Density (S3 HD) está diseñado para multiinquilino y grandes cantidades de índices pequeños (3000 índices por servicio). S3 HD no proporciona la característica de indexador y la ingesta de datos debe usar las API que envían datos del origen al índice.

  • El plan de tarifa Almacenamiento optimizado se ejecuta en máquinas dedicadas con más almacenamiento total, ancho de banda de almacenamiento y memoria que el plan Estándar. Este nivel tiene como objetivo índices grandes que cambian con lentitud. El plan Optimizado para almacenamiento se ofrece en dos niveles: L1 y L2.

Límites de suscripción

Puede crear varios servicios de búsqueda facturables (Básico y avanzado), hasta el número máximo de servicios permitidos en cada nivel por región. Por ejemplo, puede crear hasta 16 servicios en el nivel Básico y otros 16 en el nivel S1 dentro de la misma suscripción y región. Después, podría crear 16 servicios Básico adicionales en otra región para un total combinado de 32 servicios básicos en la misma suscripción. Para más información sobre los niveles, consulte Elegir un nivel (o SKU) para Azure AI Search.

El límite máximo de servicios se puede elevar a petición. Si necesita tener más servicios en la misma suscripción, envíe una solicitud de soporte técnico.

Resource Gratis 1 Basic S1 S2 S3 S3 HD L1 L2
Máximo de servicios por región 1 16 16 8 6 6 6 6
Número máximo de unidades de búsqueda (SU)2 N/D 3 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda 36 unidades de búsqueda

1 Puede tener un servicio de búsqueda gratuito por suscripción de Azure. El nivel gratuito se basa en la infraestructura compartida con otros clientes. Dado que el hardware no está dedicado, no se admite el escalado vertical y el almacenamiento está limitado a 50 MB. Es posible que se elimine un servicio de búsqueda gratuito después de largos períodos de inactividad para que haya espacio para más servicios.

2 Las unidades de búsqueda (SU) son unidades facturables, asignadas como réplica o como partición. Necesita ambos. Para obtener más información sobre las combinaciones de SU, consulte Estimación y administración de la capacidad de un servicio de búsqueda.

Límites de servicio

En la tabla siguiente se tratan los SLA, los recuentos de particiones y los recuentos de réplicas en el nivel de servicio.

Resource Gratuito Básico S1 S2 S3 S3 HD L1 L2
Acuerdo de Nivel de Servicio (SLA) No
Particiones N/D 3 1 12 12 12 3 12 12
Réplicas N/D 3 12 12 12 12 12 12

1 Nivel Basic admite tres particiones y tres réplicas, para un total de nueve unidades de búsqueda (SU) en nuevos servicios de búsqueda creados después del 3 de abril de 2024. Los servicios básicos más antiguos están limitados a una partición y tres réplicas.

Un servicio de búsqueda está sujeto a un límite máximo de almacenamiento (tamaño de partición multiplicado por el número de particiones) o por un límite máximo en el número máximo de índices o indexadores, lo que ocurra primero.

Los acuerdos de nivel de servicio (SLA) se aplican a los servicios facturables que tienen dos o más réplicas para cargas de trabajo de consulta, o tres o más réplicas para cargas de trabajo de consulta e indexación. El número de particiones no se tiene en cuenta en el contrato de nivel de servicio. Para más información, consulte Confiabilidad en Azure AI Search.

Los servicios gratuitos no tienen particiones ni réplicas fijas y comparten recursos con otros suscriptores.

Almacenamiento de particiones (GB)

Los límites de almacenamiento por servicio varían en dos aspectos: fecha de creación del servicio, y región. Hay límites más altos para los servicios más recientes en la mayoría de las regiones admitidas.

En esta tabla se muestra la progresión de los aumentos de cuota de almacenamiento en GB a lo largo del tiempo. Las particiones de mayor capacidad se pusieron en línea a partir de abril de 2024, en las regiones enumeradas en las notas al pie. Una mayor capacidad se limita a nuevos servicios de búsqueda. No hay ninguna actualización local en este momento.

Fecha de creación del servicio Básico S1 S2 S3/HD L1 L2
Antes del 3 de abril de 2024 2 25 100 200 1024 2 048
3 de abril de 2024 hasta el 17 de mayo de 2024 1 15 160 512 1,024 1024 2 048
Después del 17 de mayo de 2024 2 15 160 512 1024 2,048 4,096

1 Almacenamiento de capacidad superior para Basic, S1, S2, S3 en estas regiones. Americas: Sur de Brasil, Centro de Canadá, Este de Canadá, Este de EE. UU., Este de EE. UU. 2, ​Centro de EE. UU., Centro-norte de EE. UU., Centro-sur de EE. UU., Oeste de EE. UU., Oeste de EE. UU. 2, Oeste de EE. UU. 3, Centro-oeste de EE. UU. Europa: Centro de Francia. Norte de Italia, Norte de Europa, Este de Noruega, Centro de Polonia, Norte de Suiza, Centro de Suecia. Sur de Reino Unido, Oeste de Reino Unido. Oriente Medio: Norte de Emiratos Árabes Unidos. África: Norte de Sudáfrica. Asia Pacífico: Este de Australia, Sudeste de Australia, India Central, oeste de la India, Este de Asia, sudeste de Asia, Este de Japón, oeste de JapónCentro de Corea del Sur, Corea del Sur.

2 Almacenamiento de capacidad superior para L1 y L2. Más regiones proporcionan mayor capacidad en cada nivel facturable. Europa: Norte de Alemania, Centro-oeste de Alemania y Oeste de Suiza. Azure Government: (Texas, Arizona y Virginia). Africa: Norte de Sudáfrica. Asia Pacífico: Norte de China 3, Este de China 3.

Algunas regiones todavía se ejecutan en una infraestructura anterior, sujeta a los límites del 3 de abril. Antes de crear un nuevo servicio, compruebe regiones admitidas para asegurarse de que la región que prefiera proporciona la capacidad adicional.

Límites de índice

Recurso Gratuito Básico 1 S1 S2 S3 S3 HD L1 L2
Índices máximos 3 5 o 15 50 200 200 1000 GB por partición o 3000 por servicio 10 10
Campos simples máximos por índice 2 1 000 100 1000 1000 1000 1000 1000 1000
Dimensiones máximas por campo de vector 4098 4098 4098 4098 4098 4098 4098 4098
Colecciones complejas máximas por índice 40 40 40 40 40 40 40 40
Elementos máximos en todas las colecciones complejas por documento 3 3000 3000 3000 3000 3000 3000 3000 3000
Profundidad máxima de campos complejos 10 10 10 10 10 10 10 10
Proveedores de sugerencias máximos por índice 1 1 1 1 1 1 1 1
Perfiles de puntuación máximos por índice 100 100 100 100 100 100 100 100
Funciones máximas por perfil 8 8 8 8 8 8 8 8
Tamaño máximo de índice 4 N/D N/D N/D 1,88 TB 2,34 TB 100 GB N/D N/D

1 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices. El nivel básico es el único nivel con un límite inferior de 100 campos por índice.

2 El límite superior de los campos incluye campos de primer nivel y subcampos anidados en una colección compleja. Por ejemplo, si un índice contiene 15 campos y tiene dos colecciones complejas con 5 subcampos cada uno, el recuento de campos del índice es 25. Los índices que tengan una colección de campos muy grandes pueden ser lentos. Limite los campos y atributos a solo los que necesite y ejecute la indexación y la prueba de consulta para asegurarse de que el rendimiento sea aceptable.

3 Existe un límite superior para los elementos porque tener un gran número de ellos aumenta significativamente el almacenamiento necesario para el índice. Un elemento de una colección compleja se define como un miembro de esa colección. Por ejemplo, supongamos un documento de hotel con una colección de habitaciones compleja, donde cada habitación de dicha colección se considera un elemento. Durante la indexación, el motor de indexación puede procesar de forma segura un máximo de 3000 elementos en todo el documento. Este límite se presentó en api-version=2019-05-06 y se aplica solo a colecciones complejas, no a colecciones de cadenas ni a campos complejos.

4 En la mayoría de los niveles, el tamaño máximo del índice está disponible en el servicio de búsqueda. Para S2, S3 y S3 HD, el tamaño máximo de cualquier índice es el número proporcionado en la tabla. Se aplica a los servicios de búsqueda creados después del 3 de abril de 2024.

Es posible que encuentre alguna variación en los límites máximos si el servicio casualmente se aprovisiona en un clúster más eficaz. Los límites aquí representan el denominador común. Los índices creados con las especificaciones anteriores se pueden transportar entre los niveles de servicio equivalentes de cualquier región.

Límites de documento

El número máximo de documentos por índice son:

  • 24 mil millones en Básico, S1, S2, S3
  • 2 mil millones en S3 HD
  • 288 mil millones en L1
  • 576 mil millones en L2

Cada instancia de una colección compleja cuenta como un documento independiente en términos de estos límites.

El tamaño máximo de cada documento es de aproximadamente 16 megabytes. El tamaño del documento es en realidad un límite del tamaño de la carga de la solicitud de la API de indexación, que es de 16 megabytes. Esa carga puede ser un solo documento o un lote de documentos. Para un lote con un único documento, el tamaño máximo del documento es de 16 MB de JSON.

El tamaño del documento se aplica a la indexación en modo de inserción que carga documentos en un servicio de búsqueda. Si usa un indexador para la indexación en modo de extracción, los archivos de origen pueden tener cualquier tamaño de archivo, sujeto a los límites del indexador. En el caso del indexador de blobs, los límites de tamaño de archivo son mayores para los niveles superiores. Por ejemplo, el límite S1 es de 128 megabytes, el límite S2 es de 256 megabytes, etc.

Al calcular el tamaño del documento, recuerde indexar solo los campos que agregan valor a los escenarios de búsqueda y excluya los campos de origen que no tienen ningún propósito en las consultas que se van a ejecutar.

Límites de tamaño del índice vectorial

Al indexar documentos con campos vectoriales, la Búsqueda de Azure AI construye índices vectoriales internos mediante los parámetros de algoritmo que proporcione. El tamaño de estos índices vectoriales está restringido por la memoria reservada para el vector de búsqueda del nivel de servicio (o SKU). Para obtener instrucciones sobre cómo administrar y maximizar el almacenamiento de vectores, consulte Tamaño del índice vector y permanencia dentro de los límites.

Los límites de vectores varían según:

Desde abril de 2024, existen límites de vectores más elevados para los nuevos servicios de búsqueda en las regiones que proporcionan la capacidad adicional, que son la mayoría.

En esta tabla se muestra la progresión de los aumentos de la cuota de vectores en GB a lo largo del tiempo. La cuota es por partición, por lo que si escala un nuevo servicio Estándar (S1) a 6 particiones, la cuota total de vectores es 35 multiplicada por 6.

Fecha de creación del servicio Básico S1 S2 S3/HD L1 L2
Antes del 1 de julio de 2023 1 0.5 1 6 12 12 36
1 de julio de 2023 hasta el 3 de abril de 2024 2 1 3 12 36 12 36
3 de abril de 2024 hasta el 17 de mayo de 2024 3 5 35 150 300 12 36
Después del 17 de mayo de 2024 4 5 35 150 300 150 300

1 Límites de vectores iniciales durante la versión preliminar temprana.

2 Límites de vectores durante el período de versión preliminar posterior. Tres regiones no tenían los límites más altos: Centro-oeste de Alemania, India Occidental, Centro de Catar.

3 Cuota de vectores superior en función de las particiones más grandes para los niveles y regiones admitidos.

4 Cuota de vectores superior para más niveles y regiones en función de las actualizaciones de tamaño de partición.

El servicio aplica una cuota de tamaño de índice vectorial para cada partición en el servicio de búsqueda. Cada partición adicional aumenta la cuota de tamaño de índice vectorial disponible. Esta cuota supone un límite estricto que sirve para asegurar que su servicio funcione correctamente, lo que significa que realizar más intentos de indexación una vez que se ha superado el límite provoca errores. Puede reanudar la indexación una vez que libere la cuota disponible eliminando algunos documentos vectoriales o escalando verticalmente en particiones.

Importante

Los límites de vectores más altos están vinculados a tamaños de partición mayores. Las regiones que se ejecutan en una infraestructura anterior están sujetas a los límites de julio a abril. Revise la lista de regiones para ver el estado de los límites de almacenamiento de las particiones.

Límites de indexador

Los tiempos de ejecución máximos existen para proporcionar equilibrio y estabilidad al servicio como un todo, pero es posible que los conjuntos de datos más grandes necesiten más tiempo de indexación que el que permite el máximo. Si un trabajo de indexación no se puede completar en el tiempo máximo permitido, intente ejecutarlo en una programación. El programador realiza un seguimiento del estado de la indexación. Si un trabajo programado de indexación se interrumpe por cualquier motivo, el indizador puede reanudarlo donde se quedó en la siguiente ejecución programada.

Recurso Gratis 1 Básico 2 S1 S2 S3 S3 HD 3 L1 L2
Indexadores máximos 3 5 o 15 50 200 200 N/D 10 10
Orígenes de datos máximos 3 5 o 15 50 200 200 N/D 10 10
Conjuntos de habilidades máximos 4 3 5 o 15 50 200 200 N/D 10 10
Carga máxima de indexación por invocación 10 000 documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos Limitado solamente por el número máximo de documentos N/D Sin límite Sin límite
Programación mínima 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos 5 minutos
Tiempo de ejecución máximo 5 De 1 a 3 o de 3 a 10 minutos 2 o 24 horas 2 o 24 horas 2 o 24 horas 2 o 24 horas N/D 2 o 24 horas 2 o 24 horas
Indexador de blobs: tamaño máximo de blob, MB 16 16 128 256 256 N/D 256 256
Indexador de blobs: número máximo de caracteres del contenido extraído de un blob 6 32 000 64 000 4 millones 8 millones 16 millones N/D 4 millones 4 millones

1 Los servicios gratuitos tienen un tiempo de ejecución máximo del indexador de 3 minutos para servicios de blob y de 1 minuto para todos los demás orígenes de datos. La invocación del indexador es una vez cada 180 segundos. Para la indexación de IA que llama a los servicios de Azure AI, los servicios gratuitos se limitan a 20 transacciones gratuitas por indexador por día, donde una transacción se define como un documento que pasa correctamente a través de la canalización de enriquecimiento (sugerencia: puedes restablecer un indexador para restablecer su recuento).

2 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los indexadores, los orígenes de datos y los conjuntos de aptitudes.

3 Los servicios S3 HD no incluyen compatibilidad con el indexador.

4 Máximo de 30 habilidades por conjunto de habilidades.

5 Con respecto a la duración máxima de 2 o 24 horas para los indexadores: un máximo de 2 horas es el más común y es lo que debe planear. Hace referencia a los indexadores que se ejecutan en el entorno público, que se usan para descargar el procesamiento intensivo de cálculo y dejar más recursos para las consultas. El límite de 24 horas se aplica si configura el indexador para que se ejecute en un entorno privado usando solo la infraestructura asignada al servicio de búsqueda. Tenga en cuenta que algunos indexadores más antiguos no pueden ejecutarse en el entorno público y esos indexadores siempre tienen un rango de procesamiento de 24 horas. Si tiene indexadores no programados que se ejecutan continuamente durante 24 horas, se puede asumir que esos indexadores no se pudieron migrar a la infraestructura más reciente. Como regla general, para los trabajos de indexación que no se pueden finalizar en dos horas, coloque el indexador en una programación de 5 minutos para que el indexador pueda reanudar el trabajo rápidamente dónde lo dejó. En el nivel Gratis, el tiempo de ejecución máximo de 3 a 10 minutos es para los indexadores con conjuntos de aptitudes.

6 El número máximo de caracteres se basa en unidades de código Unicode, específicamente UTF-16.

Nota:

Como se indica en el apartado Límites de índice, los indexadores también aplicarán el límite superior de 3000 elementos en todas las colecciones complejas por documento a partir de la versión de la API de disponibilidad general más reciente que admita tipos complejos (2019-05-06) en adelante, lo que significa que si ha creado un indexador con una versión anterior de la API, no estará sujeto a ese límite. Para conservar la máxima compatibilidad, los indexadores que se crearon con una versión anterior de la API y, después, se actualizaron con una versión de la API 2019-05-06, o posterior, seguirá estando excluido de los límites. Los clientes deben ser conscientes del impacto negativo de tener colecciones muy complejas (como se ha indicado anteriormente) y recomendamos encarecidamente que se creen todos los indexadores con la versión de la API de disponibilidad general más reciente.

Los indexadores pueden acceder a otros recursos de Azure mediante puntos de conexión privados administrados con la API de recursos compartidos de Private Link. En esta sección se describen los límites asociados a esta funcionalidad.

Recurso Gratuito Básico S1 S2 S3 S3 HD L1 L2
Compatibilidad con indexador de puntos de conexión privados No No
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes1 No N.º No No
Compatibilidad con puntos de conexión privados para indexadores con un conjunto de aptitudes y vectorización integrada 2 No No
Número máximo de puntos de conexión privados N/D 10 o 30 100 400 400 N/D 20 20
Máximo de tipos de recursos distintos3 N/D 4 7 15 15 N/D 4 4

1 El análisis de imágenes y el enriquecimiento con IA consumen muchos recursos informáticos y una cantidad desproporcionada de la potencia de procesamiento disponible. Por este motivo, las conexiones privadas están deshabilitadas en niveles inferiores para garantizar el rendimiento y la estabilidad del propio servicio de búsqueda.

2Los servicios de alta capacidad creados después del 3 de abril de 2024 en las regiones enumeradas en Partition Storage y la ejecución de cargas de trabajo de vectorización integrada en tiempo de indexación admiten vínculos privados compartidos en niveles de pago. El sistema debe detectar al menos una aptitud que inserte datos.

3 El número de tipos de recursos distintos se calcula como el número de valores de groupId únicos utilizados en todos los recursos de vínculo privado compartidos para un servicio de búsqueda determinado, independientemente del estado del recurso.

Límites de sinónimos

El número máximo de asignaciones de sinónimos varía según el nivel. Cada regla puede tener hasta 20 expansiones, donde una expansión es un término equivalente. Por ejemplo, dado el término "gato", la asociación con "gatito", "felino" y "felis" (el género de gatos) contaría como 3 expansiones.

Recurso Gratuito Básico S1 S2 S3 S3-HD L1 L2
Asignaciones máximas de sinónimos 3 3 5 10 20 20 10 10
Número máximo de reglas por asignación 5000 20000 20000 20000 20000 20000 20000 20000

Límites de alias de índice

El número máximo de alias de índice varía según el nivel y la fecha de creación del servicio. En todos los niveles, si el servicio se creó después de octubre de 2022, el número máximo de alias es el doble del número máximo de índices permitido. Si el servicio se creó antes de octubre de 2022, el límite es el número de índices permitidos.

Fecha de creación del servicio Gratuito Básico S1 S2 S3 S3-HD L1 L2
Antes de octubre de 2022 3 5 o 15 1 50 200 200 1000 GB por partición o 3000 por servicio 10 10
Después de octubre de 2022 6 30 100 400 400 2000 GB por partición o 6000 por servicio 20 20

1 Los servicios básicos creados antes de diciembre de 2017 tienen límites inferiores (5 en lugar de 15) en los índices

Límites de datos (enriquecimiento de inteligencia artificial)

Una canalización de enriquecimiento con IA que realiza llamadas a un recurso de lenguaje de Azure AI para el reconocimiento de entidades, la vinculación de entidades, la extracción de frases clave, el análisis de sentimiento, la detección de idioma y la detección de información personal está sujeta a los límites de datos. El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si tiene que dividir los datos antes de enviarlos al analizador de opiniones, use la aptitud División de texto.

Limitaciones

Las solicitudes de API se limitan a medida que el sistema se aproxima a la capacidad máxima. La limitación se comporta de forma diferente para las distintas API. Las API de consulta (Search/Suggest/Autocomplete) y las de indexación se limitan dinámicamente en función de la carga del servicio. Las API de índice y las API de operaciones de servicio tienen límites estáticos de frecuencia de solicitud.

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un índice:

  • Enumerar índices (GET /indexes): 3 por segundo por unidad de búsqueda
  • Obtener índice (GET /indexes/myindex): 10 por segundo por unidad de búsqueda
  • Crear índice (POST /indexes): 12 por minuto por unidad de búsqueda
  • Crear o actualizar índice (PUT /indexes/myindex): 6 por segundo por unidad de búsqueda
  • Eliminar índice (DELETE /indexes/myindex): 12 por minuto por unidad de búsqueda

Límites estáticos de frecuencia de solicitudes para las operaciones relacionadas con un servicio:

  • Estadísticas de servicio (GET /servicestats): 4 por segundo por unidad de búsqueda

La reclasificación de L2 mediante el reclasificador semántico tiene un volumen esperado:

  • Hasta 10 consultas simultáneas por réplica. Si prevé requisitos de rendimiento uniformes a corto plazo (en este nivel o en uno superior) envíe una incidencia de soporte técnico para que podamos aprovisionar la carga de trabajo.

Límites de solicitud de API

Con excepción de donde se indique, las siguientes solicitudes de API se aplican a todas las interfaces programables, incluidos los SDK de Azure.

  • Máximo de 16 MB por indexación o solicitud de consulta al insertar una carga en el servicio de búsqueda 1
  • Longitud máxima de la URL de 8 KB (solo se aplica a las API REST)
  • Máximo de 1000 documentos por lote de cargas, combinaciones o eliminaciones de índices
  • Máximo de 32 campos en cláusula $orderby
  • Máximo de 100 000 caracteres en una cláusula de búsqueda
  • El número máximo de cláusulas en search (expresiones separadas por AND u OR) es 1024.
  • El tamaño máximo del término de búsqueda es de 32 766 bytes (32 KB menos 2 bytes) de texto con codificación UTF-8
  • El tamaño máximo del término de búsqueda es de 1000 caracteres para la búsqueda de prefijos y la búsqueda de expresiones regulares
  • La búsqueda de caracteres comodín y la búsqueda de expresiones regulares se limitan a un máximo de 1,000 estados cuando las procesa Lucene.

1 En Azure AI Search, el cuerpo de una solicitud está sujeto a un límite superior de 16 MB, lo que impone un límite práctico sobre el contenido de campos individuales o colecciones que no están restringidos de algún modo por límites teóricos (vea Tipos de datos admitidos para obtener más información sobre composición de campos y restricciones).

Existen límites en el tamaño y la composición de las consultas porque las consultas sin enlazar pueden desestabilizar el servicio de búsqueda. Normalmente, estas consultas se crean mediante programación. Si la aplicación genera consultas de búsqueda mediante programación, se recomienda diseñarla de manera que no genere consultas de tamaño ilimitado.

Límites de respuesta de API

  • Máximo de 1000 documentos devueltos por página de resultados de búsqueda
  • Máximo de 100 sugerencias devueltas por solicitud de Sugerir API

Límites de clave de API

Las claves de API se usan para la autenticación del servicio. Hay dos tipos. Las claves de administración se especifican en el encabezado de solicitud y conceden acceso completo de lectura y escritura al servicio. Las claves de consulta son de solo lectura, se especifican en la dirección URL y normalmente se distribuyen a las aplicaciones cliente.

  • Máximo de 2 claves de administración por servicio
  • Máximo de 50 claves de consultas por servicio