Configuración del clasificador semántico y los subtítulos devueltos en los resultados de la búsqueda

La clasificación semántica recorre en iteración un conjunto de resultados inicial, aplicando una metodología de clasificación L2 que promueve los resultados más semánticamente relevantes en la parte superior de la pila. También puede obtener leyendas semánticas, con los términos y las frases más relevantes resaltados, además de respuestas semánticas.

En este artículo se explica cómo configurar un índice de búsqueda para el cambio semántico.

Requisitos previos

  • Un servicio de búsqueda en un nivel básico o superior, sujeto a la disponibilidad de la región.

  • Clasificador semántico habilitado en el servicio de búsqueda.

  • Índice de búsqueda existente con contenido de texto enriquecido. La clasificación semántica se aplica a los campos de cadenas (no vectoriales) y funciona mejor en el contenido que es informativo o descriptivo.

Elija un cliente

Puede usar cualquiera de las siguientes herramientas y kits de desarrollo de software (SDK) para agregar una configuración semántica:

Adición de una configuración semántica

Una configuración semántica es una sección del índice que establece entradas de campo para la clasificación semántica. Puedes agregar o actualizar una configuración semántica en cualquier momento sin necesidad de recompilar. Si creas varias configuraciones, puedes especificar un valor predeterminado. En el momento de la consulta, especifica una configuración semántica en una solicitud de consulta o déjala en blanco para usar el valor predeterminado.

Una configuración semántica tiene un nombre y las siguientes propiedades:

Propiedad Características
Campo Título Una cadena corta, idealmente por debajo de 25 palabras. Este campo podría ser el título de un documento, el nombre de un producto o un identificador único. Si no tienes un campo adecuado, déjalo en blanco.
Campos de contenido Fragmentos más largos de texto en formato de lenguaje natural, sujeto a límites máximos de entrada de token en los modelos de Machine Learning. Algunos ejemplos comunes de contenido son el cuerpo de un documento, la descripción de un producto u otro texto de formato libre.
Campos de palabra clave Una lista de palabras clave, como las etiquetas de un documento o un término descriptivo, como la categoría de un elemento.

Solo puedes especificar un campo de título, pero puedes tener tantos campos de contenido y palabra clave como quieras. Enumera estos campos en orden de prioridad, ya que los campos de prioridad inferior pueden truncarse.

En todas las propiedades de configuración semántica, los campos que asignes deben ser:

  • Atributos como searchable y retrievable
  • Cadenas de tipo Edm.String, Collection(Edm.String), subcampos de cadena de Edm.ComplexType
  1. Inicia sesión en Azure Portal y ve al servicio de búsqueda que tiene la clasificación semántica habilitada.

  2. En Índices en el panel de navegación de la izquierda, seleccione un índice.

  3. Seleccione Configuraciones semánticas y después Agregar configuración semántica.

    Recorte de pantalla en el que se muestra la opción de agregar una configuración semántica en Azure Portal.

  4. En la página Nueva configuración semántica, escriba un nombre de configuración semántica y seleccione los campos que se van a usar en ella. Solo los campos de cadena que se pueden buscar y recuperar son aptos. Asegúrese de enumerar los campos de contenido y los campos de palabra clave en orden de prioridad.

    Captura de pantalla que muestra cómo crear una configuración semántica en Azure Portal.

  5. Seleccione Guardar para guardar la configuración.

  6. Vuelva a seleccionar Guardar en la página de índice para guardar la configuración semántica en el índice.

Migrar desde versiones preliminares

Si el código de clasificación semántica usa API en versión preliminar, en esta sección se explica cómo migrar a versiones estables. Puede comprobar los registros de cambios para comprobar la disponibilidad general:

queryLanguage para el clasificador semántico

A partir del 14 de julio de 2023, el clasificador semántico es independiente del lenguaje. Puede volver a generar resultados compuestos de contenido multilingüe, sin sesgo hacia un idioma específico. En las versiones preliminares, la clasificación semántica desprioritizaría los resultados que difieren del idioma especificado por el analizador de campos.

Deje de usar queryLanguage en el código en caso de que lo utilizara para la clasificación semántica. La propiedad queryLanguage todavía se aplica a características como la de corrección ortográfica, pero no a la clasificación semántica.

searchFields para el clasificador semántico

Para la API REST y todos los paquetes de SDK destinados a la versión 2021-04-30-Preview y versiones posteriores, la propiedad searchFields ya no se usa para la clasificación semántica.

En su lugar, use la propiedad semanticConfiguration (en un índice de búsqueda) para determinar qué campos de búsqueda se usan en la clasificación semántica. Para especificar la priorización de campos, agregue un elemento semanticConfiguration a un esquema de índice siguiendo las instrucciones de este artículo.

Puede mantener searchFields en las solicitudes de consulta si lo usa para limitar la búsqueda de texto completo a la lista de campos con nombre.

Pasos siguientes

Pruebe la configuración semántica mediante la ejecución de una consulta semántica.