Novedades de Azure AI Search
Azure Cognitive Search ahora es Azure AI Search. Obtén información acerca de las actualizaciones más recientes de la funcionalidad, los documentos y los ejemplos de Azure AI Search.
Nota:
Las características en versión preliminar se anuncian aquí, pero también tenemos una lista de característica en vista previa (GB) para que pueda encontrarlas en un solo lugar.
Octubre de 2024
Elemento | Tipo | Descripción |
---|---|---|
Reducir los requisitos de dimensión para los modelos de inserción de texto entrenados por MRL en Azure OpenAI | Característica | La inserción de texto-3-small y Text-embeding-3-large se entrena mediante Matryoshka Representation Learning (MRL). Esto permite truncar los vectores de inserción en menos dimensiones y ajustar el equilibrio entre el uso del tamaño del índice vectorial y la calidad de recuperación. Un nuevo truncationDimension en 2024-09-01-preview permite el acceso a la compresión MRL en los modelos de inserción de texto. Esto solo se puede configurar para nuevos campos vectoriales. |
Desempaquetar @search.score para ver las subscores en los resultados de la búsqueda híbrida |
Característica | Puede investigar los resultados clasificados de La fusión de clasificación recíproca (RRF) viendo las subscores de consulta individuales del resultado final combinado y puntuado. Una nueva propiedad debug desempaqueta la puntuación de búsqueda. QueryResultDocumentSubscores , QueryResultDocumentRerankerInput y QueryResultDocumentSemanticField proporcionan los detalles adicionales. Estas definiciones están disponibles en 2024-09-01-preview. |
Filtros de destino en una búsqueda híbrida solo para las consultas vectoriales | Característica | Un filtro en una consulta híbrida implica todas las subconsultas de la solicitud, independientemente del tipo. Puede invalidar el filtro global para limitar el ámbito del filtro a una subconsulta específica. El nuevo parámetro filterOverride está disponible en consultas híbridas mediante 2024-09-01-preview. |
Aptitud de división de texto (fragmentación de token) | Inteligencia artificial aplicada (aptitudes) | Esta aptitud tiene nuevos parámetros que mejoran la fragmentación de datos para insertar modelos. Un nuevo parámetro unit permite especificar la fragmentación de tokens. Ahora puede fragmentar por longitud de token, estableciendo la longitud en un valor que tenga sentido para el modelo de inserción. También puede especificar el tokenizador y los tokens que no se deben dividir durante la fragmentación de datos. Las nuevas definiciones de parámetro unit y subpuntuación de consulta se encuentran en el 2024-09-01-preview. |
2024-09-01-preview | API | Versión preliminar de las API de REST para dimensiones truncadas en modelos de inserción de texto-3, filtrado de vectores de destino para consultas híbridas, detalles de subpuntuación de RRF para depuración y fragmentación de tokens para la aptitud División de texto. |
Soporte técnico del portal para el cifrado de claves administradas por el cliente (CMK) | Característica | Al crear nuevos objetos en Azure Portal, ahora puede especificar el cifrado de CMK y seleccionar una instancia de Azure Key Vault para proporcionar la clave. |
Agosto de 2024
Elemento | Tipo | Descripción |
---|---|---|
Mejoras en la sesión de depuración | feature | Hay dos mejoras importantes. En primer lugar, ahora puede depurar cargas de trabajo integradas de vectorización y fragmentación de datos. En segundo lugar, las sesiones de depuración se rediseñan para una presentación más simplificada de aptitudes y asignaciones. Puede seleccionar un objeto en el flujo y ver o editar sus detalles en un panel lateral. El diseño con pestañas anterior se reemplaza por información más contextual en la página. |
2024-07-01 | API | Versión estable de las API REST para tipos de datos vectoriales disponibles con carácter general, compresión de vectores y vectorización integrada durante la indexación y las consultas. |
Vectorización integrada | Característica | Anuncio de disponibilidad general. Fragmentación e inserción de datos controlados por aptitudes durante la indexación. |
Vectorizadores | Característica | Anuncio de disponibilidad general. Conversión de texto a vector durante la ejecución de la consulta. Tanto el vectorizador de Azure OpenAI como el vectorizador de API web personalizado están disponibles con carácter general. |
Capacidad AzureOpenAIEmbedding | Característica | Anuncio de disponibilidad general. Un tipo de aptitud que llama a un modelo de inserción de Azure OpenAI para generar incrustaciones durante la indexación. |
Proyecciones de índice | Característica | Anuncio de disponibilidad general. Componente de una definición de conjunto de aptitudes que define la forma de un índice secundario, que admite un patrón de índice uno a varios, donde el contenido de una canalización de enriquecimiento puede tener como destino varios índices. |
Cuantificación binaria y escalar | Característica | Anuncio de disponibilidad general. Reduzca el tamaño del índice vectorial en la memoria y en el disco con la cuantificación integrada. |
Tipos de datos estrechos | Característica | Anuncio de disponibilidad general. Asigne un tipo de datos más pequeño en los campos vectoriales, suponiendo que los datos entrantes sean de ese tipo de datos. |
Asistente para la importación y vectorización de datos | Azure portal | Anuncio de disponibilidad general. Asistente que crea una canalización de indexación completa que incluye fragmentación de datos y vectorización. El asistente crea todos los objetos y configuraciones necesarios. En esta versión se agrega compatibilidad con el asistente para Azure Data Lake en Azure Storage. |
propiedad almacenada | Característica | Anuncio de disponibilidad general. Booleano que reduce el almacenamiento de índices vectoriales al no almacenar vectores recuperables. |
Propiedad vectorQueries.Weight | Característica | Anuncio de disponibilidad general. Especifique el peso relativo de cada consulta vectorial en una operación de búsqueda. |
Julio de 2024
Elemento | Tipo | Descripción |
---|---|---|
Interactúe con sus datos | Acelerador | Acelerador de soluciones para el patrón RAG que se ejecuta en Azure, mediante Azure AI Search para la recuperación y los modelos de lenguaje grande de Azure OpenAI para crear experiencias de búsqueda conversacional. El código con datos de ejemplo está disponible para escenarios de casos de uso como asesor financiero y revisión y resumen de contratos. |
Minería de conocimiento conversacional | Acelerador | Un acelerador de soluciones basado en Azure AI Search, Azure Speech y los servicios de Azure OpenAI que permiten a los clientes extraer información procesable de las conversaciones posteriores al centro de contactos. |
Compilación de su propio copiloto | Acelerador | Cree su propia solución de copiloto personalizada que permite al Asesor de clientes aprovechar la eficacia de la inteligencia artificial generativa en datos estructurados y no estructurados. Ayudar a nuestros clientes a optimizar las tareas diarias y fomentar mejores interacciones con más clientes. |
Junio de 2024
Elemento | Tipo | Descripción |
---|---|---|
Búsqueda de imágenes en Azure Portal | Característica | El explorador de búsqueda ahora admite la búsqueda de imágenes. En un índice vectorial que tiene contenido de imagen vectorial, puede colocar imágenes en el Explorador de búsqueda para consultar una coincidencia. |
Mayo de 2024
Elemento | Tipo | Descripción |
---|---|---|
Mayor capacidad y más cuota de vectores en cada nivel (misma tasa de facturación) | Infraestructura | En la mayoría de las regiones, los tamaños de partición ahora son aún mayores para Standard 2 (S2), Standard 3 (S3) y Standard 3 High Density (S3 HD) para los servicios creados después del 3 de abril de 2024. Para obtener las particiones más grandes, cree un nuevo servicio en una región que proporcione una infraestructura más reciente. Los niveles optimizados para almacenamiento (L1 y L2) también tienen más capacidad. Los clientes L1 y L2 deben crear un nuevo servicio para beneficiarse de la mayor capacidad. No hay ninguna actualización local en este momento. Ya hay capacidad adicional disponible en más regiones: Norte de Alemania, Centro-oeste de Alemania, Norte de Sudáfrica, Oeste de Suizay Azure Government (Texas, Arizona y Virginia). |
Integración de OneLake (versión preliminar) | Característica | Nuevo indexador para archivos OneLake y accesos directos de OneLake. Si usa Microsoft Fabric y OneLake para acceder a los datos de los orígenes de datos de Amazon Web Services (AWS) y Google, use este indizador para importar datos externos en un índice de búsqueda. Este indizador está disponible a través de Azure Portal, la APIREST 2024-05-01-versión preliminar y los paquetes beta del SDK de Azure. |
Relevancia de vector relevancia de la consulta híbrida |
Característica | Cuatro mejoras mejoran la relevancia de las búsquedas híbridas y vectoriales. En primer lugar, ahora puede establecer umbrales en los resultados de vector de búsqueda para excluir los resultados de puntuación baja. En segundo lugar, los cambios en la arquitectura de consulta aplican perfiles de puntuación al final de la canalización de consulta para cada tipo de consulta. La mejora de documentos es un perfil de puntuación común y ahora funciona según lo previsto en las consultas híbridas y vectoriales. En tercer lugar, puede establecer MaxTextRecallSize y countAndFacetMode en consultas híbridas para controlar la cantidad de resultados de búsqueda clasificados por BM25 que fluyen al modelo de clasificación híbrida. En cuarto lugar, para la búsqueda de vectores e híbridas, puede ponderar una consulta vectorial para aumentar o disminuir su importancia en una solicitud multiconsulta. |
Soporte de vectores binarios | Característica | Collection(Edm.Byte) es un nuevo tipo de datos admitido. Este tipo de datos abre la integración con los modelos de inserción binaria de Cohere v3 y la cuantificación binaria personalizada. Restringir los tipos de datos reduce el costo de los conjuntos de datos vectoriales grandes. Consulte Indexar datos binarios para el vector de búsqueda para obtener más información. |
Aptitud de inserción multimodal de Azure AI Vision (versión preliminar) | Aptitud | Nueva aptitud vinculada a la API de inserción multimodal de Azure AI Vision. Puede generar inserciones para texto o imágenes durante la indexación. Esta aptitud está disponible a través de Azure Portal y la APIREST 2024-05-01-versión preliminar. |
Vectorizador de Azure AI Vision (versión preliminar) | Vectorizador | El nuevo vectorizador se conecta a un recurso de Azure AI Vision mediante la API de inserciones multimodales para generar inserciones en el momento de la consulta. Este vectorizador está disponible a través de Azure Portal y la APIREST 2024-05-01-versión preliminar. |
Vectorizador del catálogo de modelos de Azure AI Studio (versión preliminar) | Vectorizador | El nuevo vectorizador se conecta a un modelo de inserción implementado desde el catálogo de modelos de Azure AI Studio . Este vectorizador está disponible a través de Azure Portal y la APIREST 2024-05-01-versión preliminar. Cómo implementar la vectorización integrada mediante modelos de Azure AI Studio. |
aptitud AzureOpenAIEmbedding (versión preliminar) admite más modelos en Azure OpenAI | Aptitud | Ahora admite text-embedding-3-large y text-embedding-3-small, junto con text-embedding-ada-002 de la actualización anterior. Las nuevas propiedades dimensions y modelName permiten especificar los distintos modelos de inserción en Azure OpenAI. Anteriormente, los límites de dimensiones se fijaban en 1536 dimensiones, aplicables solo a text-embedding-ada-002. Esta aptitud actualizada está disponible a través de Azure Portal y la API REST 2024-05-01-preview. |
Actualizaciones de Azure Portal | Portal | El Asistente para importar y vectorizar datos ahora admite indexadores OneLake como origen de datos. En el caso de las inserciones, también admite conexiones con el multimodal de Azure AI Vision, el catálogo de modelos de Azure AI Studio y más modelos de inserción en Azure OpenAI. Al agregar un campo a un índice, puede elegir un tipo de datos binario. El Explorador de búsqueda ahora tiene como valor predeterminado 2024-05-01-preview y admite las nuevas características de vista previa para consultas vectoriales e híbridas. |
2024-05-01-preview | API | La nueva versión preliminar de las API REST de búsqueda proporciona nuevas aptitudes y vectorizadores, nuevo tipo de datos binario, indizador de archivos OneLake y nuevos parámetros de consulta para obtener resultados más relevantes. recuperación. Consulte actualizar las API de Rest si tiene código existente escrito en la versión 2023-07-01-preview y debe migrar a esta versión. |
Paquetes beta de Azure SDK | API | Revise los registros de cambios de los siguientes paquetes beta del SDK de Azure para obtener compatibilidad con nuevas características: SDK de Azure para Python, SDK de Azure para .NET, SDK de Azure para Java |
Ejemplos de código de Python | Ejemplos | Los nuevos ejemplos de un extremo a otro demuestran la integración con Cohere Embed v3, la integración con OneLake y las plataformas de datos en la nube de Google y AWS y la integración con las API multimodales de Azure AI Vision. |
Abril de 2024
Elemento | Tipo | Descripción |
---|---|---|
Divulgación de información de direccionamiento de actualización de seguridad | API | Las respuestas GET ya no devuelven cadenas de conexión ni claves. Se aplica a GET Skillset, GET Index y GET Indexer. Este cambio ayuda a proteger los recursos de Azure integrados con AI Search frente al acceso no autorizado. |
Más almacenamiento en los niveles Básico y Estándar | Infraestructura | Básico ahora admite hasta tres particiones y tres réplicas. Los niveles Básico y Estándar (S1, S2, S3) tienen mucho más almacenamiento por partición, con la misma tasa de facturación por partición. La capacidad adicional está sujeta a la disponibilidad regional y se aplica a los nuevos servicios de búsqueda creados después del 3 de abril de 2024. Actualmente, no hay ninguna actualización local, por lo que debe crear un nuevo servicio de búsqueda para obtener el almacenamiento adicional. |
Más cuota para vectores | Infraestructura | Las cuotas de vectores también son mayores en los nuevos servicios creados después del 3 de abril de 2024 en las regiones seleccionadas. |
Cuantificación vectorial, tipos de datos de vectores estrechos y una nueva propiedad stored (versión preliminar) |
Característica | En conjunto, estas tres características agregan compresión de vectores y opciones de almacenamiento más inteligentes. En primer lugar, la cuantificación escalar reduce el tamaño del índice vectorial en la memoria y en el disco. En segundo lugar, los tipos de datos estrechos reducen el almacenamiento por campo al almacenar valores más pequeños. En tercer lugar, puede usar stored para no almacenar la copia adicional de un vector que solo se usa para los resultados de búsqueda. Si no necesita vectores en una respuesta de consulta, puede establecer stored en false para ahorrar espacio. |
API de REST de Azure Cognitive Search versión preliminar del 01-03-2024 | API | Nueva versión preliminar de las API REST de Azure Cognitive Search para los nuevos tipos de datos, propiedades de compresión de vectores y opciones de almacenamiento de vectores. |
API REST de Administración versión preliminar de 01-03-2024 | API | Nueva versión preliminar de las API de REST de Administración para las operaciones del plano de control. |
anuncio de desuso de 2023-07-01- versión preliminar | API | Desuso anunciado el 8 de abril de 2024. Deja de ser compatible el 8 de julio de 2024. Esta fue la primera API de REST que ofrecía compatibilidad con el vector de búsqueda. Las versiones más recientes de API tienen una configuración de vector diferente. Debe migrar a una versión más reciente lo antes posible. |
Febrero de 2024
Elemento | Tipo | Descripción |
---|---|---|
Nuevos límites de dimensión | Característica | En el caso de los campos vectoriales, los límites máximos de dimensión son ahora 3072 , frente a 2048 . |
Anuncios de 2023
Mes | Tipo | Anuncio |
---|---|---|
Noviembre | Característica | Vector de búsqueda, disponible con carácter general. Ahora se ha elevado la restricción anterior en las claves administradas por el cliente (CMK). El filtrado previo y algoritmo de vecino más próximo K ahora también están disponibles con carácter general. |
Noviembre | Característica | Clasificador semántico, disponible con carácter general |
Noviembre | Característica | La Vectorización integrada (versión preliminar) agrega conversiones de fragmentación de datos y de texto a vector durante la indexación y también agrega conversiones de texto a vector en el momento de la consulta. |
Noviembre | Característica | El Asistente para importar y vectorizar datos (versión preliminar) automatiza la fragmentación y la vectorización de datos. Tiene como destino la API REST 2023-10-01-Preview. |
Noviembre | Característica | Las proyecciones de índice (versión preliminar) define la forma de un índice secundario, utilizado para un patrón de índice de uno a muchos, en el que el contenido de una canalización de enriquecimiento puede dirigirse a varios índices. |
Noviembre | API | La API de REST de búsqueda del 01-11-2023 es una versión estable de las API de REST de búsqueda para la búsqueda de vectores y la clasificación semántica. Consulte Actualizar las API de REST para conocer los pasos de migración a las características disponibles en disponibilidad general. |
Noviembre | API | La API de REST de administración del 01-11-2023 agrega API que habilitan o deshabilitan el clasificador semántico. |
Noviembre | Aptitud | La capacidad de inserción de Azure OpenAI (versión preliminar) se conecta a un modelo de inserción implementado en el recurso de Azure OpenAI para generar inserciones durante la ejecución del conjunto de aptitudes. |
Noviembre | Aptitud | La capacidad de división de texto (versión preliminar) se actualizó en la versión preliminar del 01-10-2023 para admitir la fragmentación de datos nativos. |
Noviembre | Vídeo | El modo en que los vectores de búsqueda y la clasificación semántica mejoran las solicitudes de GPT explica cómo la recuperación híbrida proporciona datos de base óptimos para generar respuestas útiles de inteligencia artificial y permite la búsqueda tanto en conceptos como en palabras clave. |
Noviembre | Ejemplo | El control de acceso basado en roles en aplicaciones de IA generativa explica cómo usar Microsoft Entra ID y Microsoft Graph API para implementar permisos de usuario pormenorizados en el contenido fragmentado del índice. |
Octubre | Ejemplo | Acelerador de soluciones de "Chat con sus datos". Patrón RAG de un extremo a otro que usa Azure AI Search como un recuperador. Proporciona indexación, fragmentación de datos y orquestación. |
Octubre | Característica | El exhaustivo vecino más próximo K (KNN) es un algoritmo de puntuación para la búsqueda de similitud en el espacio vectorial. Disponible solo en la API de REST versión preliminar de 1-10-2023. |
Octubre | Característica | Los filtros previos en el vector de búsqueda evalúan los criterios de filtro antes de la ejecución de la consulta, lo que reduce la cantidad de contenido que se debe buscar. Disponible solo en la API de REST de la versión preliminar de 1-10-2023, a través de una nueva propiedad vectorFilterMode en la consulta que se puede establecer en preFilter (valor predeterminado) o postFilter , según sus requisitos. |
Octubre | API | La versión preliminar del 01-10-2023 de la API de REST de búsqueda, supone un cambio importante en la definición de los campos vectoriales y las consultas vectoriales. |
Agosto | Característica | Clasificación semántica mejorada. Los modelos actualizados se implementan para el receso semántico y la disponibilidad se extiende a más regiones. Los recuentos máximos de tokens únicos se duplicaron de 128 a 256. |
Julio | Ejemplo | Demostración de vector (Azure SDK para JavaScript). Usa Node.js y la biblioteca @azure/search-documents 12.0.0-beta.2 para generar incrustaciones, crear y cargar un índice y ejecutar varias consultas vectoriales. |
Julio | Ejemplo | Demostración de vector (Azure SDK para .NET). Usa la biblioteca Azure.Search.Documents 11.5.0-beta.3 para generar incrustaciones, crear y cargar un índice y ejecutar varias consultas vectoriales. También puede probar este ejemplo desde el equipo del SDK de Azure. |
Julio | Ejemplo | Demo de Vector (Azure SDK para Python)Usa la última versión beta de azure.search.documents para generar incrustaciones, crear y cargar un índice y ejecutar varias consultas vectoriales. Visite el repositorio cognitive-search-vector-pr/demo-python para obtener más demostraciones de vector de búsqueda. |
Junio | Característica | Vista previa pública de vector de búsqueda. |
Junio | Característica | Disponibilidad de búsqueda semántica, disponible en el nivel Básico. |
Junio | API | API de REST de Azure Cognitive Search versión preliminar del 01-07-2023. Compatibilidad con el vector de búsqueda. |
Mayo | Característica | RBAC de Azure (control de acceso basado en rol, disponible con carácter general). |
Mayo | API | API de REST de administración del 01-09-2022, con compatibilidad para configurar la búsqueda para usar roles de Azure. El módulo Az.Search de Azure PowerShell y el módulo de búsqueda Az de la CLI de Azure se actualizan para admitir las opciones de autenticación del servicio de búsqueda. También puede usar el proveedor de Terraform para configurar las opciones de autenticación (consulte este inicio rápido de Terraform para obtener más información). |
Abril | Ejemplo | Implementación en varias regiones de Azure AI Search para la continuidad empresarial y la recuperación ante desastres. Scripts de implementación que configuran completamente una solución multirregional para Azure AI Search, con opciones para sincronizar contenido y redirigir solicitudes si falla un punto de conexión. |
Marzo | Ejemplo | ChatGPT + Datos empresariales con Azure OpenAI y Azure AI Search (GitHub). Código de Python y una plantilla para combinar Azure AI Search con los modelos de lenguaje grande en OpenAI. Para obtener información general, consulta esta entrada de blog de Tech Community: Revolucionar los datos empresariales con ChatGPT. Puntos clave: Usa Azure AI Search para consolidar e indexar contenido que permite búsquedas. Consultar el índice para obtener los resultados de búsqueda iniciales. Ensamblar mensajes de esos resultados y enviar al modelo gpt-35-turbo (versión preliminar) en Azure OpenAI. Devolver una respuesta entre documentos y proporcionar citas y transparencia en la aplicación orientada al cliente para que los usuarios puedan evaluar la respuesta. |
Anuncios del año anterior
Servicio de cambio de marca
Este servicio ha tenido varios nombres a lo largo de los años. Aquí están en orden cronológico inverso:
- Búsqueda de Azure AI (noviembre de 2023) Se ha cambiado el nombre para alinearse con los servicios de Azure AI y las expectativas de los clientes.
- Azure Cognitive Search (octubre de 2019) Se ha cambiado el nombre para reflejar el uso ampliado (aunque opcional) de las aptitudes cognitivas y el procesamiento de inteligencia artificial en las operaciones de servicio.
- Azure Search (marzo de 2015) Nombre original.
Actualizaciones del servicio
Los anuncios de actualización de servicios de Azure AI Search se pueden encontrar en el sitio web de Azure.
Cambio de nombre de características
Se cambió el nombre de la búsqueda semántica a clasificador semántico en noviembre de 2023 para describir mejor la característica, que proporciona la clasificación L2 de un conjunto de resultados existente.