Configuración del clasificador semántico y los subtítulos devueltos en los resultados de la búsqueda
La clasificación semántica recorre en iteración un conjunto de resultados inicial, aplicando una metodología de clasificación L2 que promueve los resultados más semánticamente relevantes en la parte superior de la pila. También puede obtener leyendas semánticas, con los términos y las frases más relevantes resaltados, además de respuestas semánticas.
En este artículo se explica cómo configurar un índice de búsqueda para el cambio semántico.
Requisitos previos
Un servicio de búsqueda en un nivel básico o superior, sujeto a la disponibilidad de la región.
Clasificador semántico habilitado en el servicio de búsqueda.
Índice de búsqueda existente con contenido de texto enriquecido. La clasificación semántica se aplica a los campos de cadenas (no vectoriales) y funciona mejor en el contenido que es informativo o descriptivo.
Elija un cliente
Puede usar cualquiera de las siguientes herramientas y kits de desarrollo de software (SDK) para agregar una configuración semántica:
- Azure Portal, mediante el diseñador de índices para agregar una configuración semántica.
- Visual Studio Code con el cliente REST
- SDK de Azure para .NET
- SDK de Azure para Python
- SDK de Azure para Java
- Azure SDK para JavaScript
Adición de una configuración semántica
Una configuración semántica es una sección del índice que establece entradas de campo para la clasificación semántica. Puedes agregar o actualizar una configuración semántica en cualquier momento sin necesidad de recompilar. Si creas varias configuraciones, puedes especificar un valor predeterminado. En el momento de la consulta, especifica una configuración semántica en una solicitud de consulta o déjala en blanco para usar el valor predeterminado.
Una configuración semántica tiene un nombre y las siguientes propiedades:
Propiedad | Características |
---|---|
Campo Título | Una cadena corta, idealmente por debajo de 25 palabras. Este campo podría ser el título de un documento, el nombre de un producto o un identificador único. Si no tienes un campo adecuado, déjalo en blanco. |
Campos de contenido | Fragmentos más largos de texto en formato de lenguaje natural, sujeto a límites máximos de entrada de token en los modelos de Machine Learning. Algunos ejemplos comunes de contenido son el cuerpo de un documento, la descripción de un producto u otro texto de formato libre. |
Campos de palabra clave | Una lista de palabras clave, como las etiquetas de un documento o un término descriptivo, como la categoría de un elemento. |
Solo puedes especificar un campo de título, pero puedes tener tantos campos de contenido y palabra clave como quieras. Enumera estos campos en orden de prioridad, ya que los campos de prioridad inferior pueden truncarse.
En todas las propiedades de configuración semántica, los campos que asignes deben ser:
- Atributos como
searchable
yretrievable
- Cadenas de tipo
Edm.String
,Collection(Edm.String)
, subcampos de cadena deEdm.ComplexType
Inicia sesión en Azure Portal y ve al servicio de búsqueda que tiene la clasificación semántica habilitada.
En Índices en el panel de navegación de la izquierda, seleccione un índice.
Seleccione Configuraciones semánticas y después Agregar configuración semántica.
En la página Nueva configuración semántica, escriba un nombre de configuración semántica y seleccione los campos que se van a usar en ella. Solo los campos de cadena que se pueden buscar y recuperar son aptos. Asegúrese de enumerar los campos de contenido y los campos de palabra clave en orden de prioridad.
Seleccione Guardar para guardar la configuración.
Vuelva a seleccionar Guardar en la página de índice para guardar la configuración semántica en el índice.
Migrar desde versiones preliminares
Si el código de clasificación semántica usa API en versión preliminar, en esta sección se explica cómo migrar a versiones estables. Puede comprobar los registros de cambios para comprobar la disponibilidad general:
- 2024-07-01 (REST)
- Registro de cambios del SDK de Azure para .NET (11.5)
- Registro de cambios del SDK de Azure para Python (11.4)
- Registro de cambios del SDK de Azure para Java (11.6)
- Registro de cambios del SDK de Azure para JavaScript (12.0)
queryLanguage para el clasificador semántico
A partir del 14 de julio de 2023, el clasificador semántico es independiente del lenguaje. Puede volver a generar resultados compuestos de contenido multilingüe, sin sesgo hacia un idioma específico. En las versiones preliminares, la clasificación semántica desprioritizaría los resultados que difieren del idioma especificado por el analizador de campos.
Deje de usar queryLanguage
en el código en caso de que lo utilizara para la clasificación semántica. La propiedad queryLanguage
todavía se aplica a características como la de corrección ortográfica, pero no a la clasificación semántica.
searchFields para el clasificador semántico
Para la API REST y todos los paquetes de SDK destinados a la versión 2021-04-30-Preview
y versiones posteriores, la propiedad searchFields
ya no se usa para la clasificación semántica.
En su lugar, use la propiedad semanticConfiguration
(en un índice de búsqueda) para determinar qué campos de búsqueda se usan en la clasificación semántica. Para especificar la priorización de campos, agregue un elemento semanticConfiguration
a un esquema de índice siguiendo las instrucciones de este artículo.
Puede mantener searchFields
en las solicitudes de consulta si lo usa para limitar la búsqueda de texto completo a la lista de campos con nombre.
Pasos siguientes
Pruebe la configuración semántica mediante la ejecución de una consulta semántica.