Información sobre la inserción

Completado

Una inserción es un tipo de representación de datos que usan los modelos de aprendizaje automático. Una inserción representa el significado semántico de un fragmento de texto. Puede visualizar una inserción como una matriz de números, y la distancia numérica entre dos incrustaciones representa su similitud semántica. Por ejemplo, si dos textos son similares, sus representaciones también deben ser similares.

Modelos de incrustración

La eficacia de los resultados de búsqueda será una correlación directa de la eficacia del modelo insertado.

Hay modelos creados específicamente para realizar una tarea específica. Use inserciones de búsqueda de similitud para capturar la similitud semántica entre fragmentos de texto. Una inserción de búsqueda de texto puede examinar la relevancia de un documento largo en una consulta corta. Usar la inserción de fragmentos de código y consultas de búsqueda en lenguaje natural mediante una inserción de búsqueda de código.

Los usuarios proporcionan una respuesta a una consulta para un modelo de inserción que se convierte de texto en un vector mediante, por ejemplo, el modelo text-embedding-ada-002 para generar incrustaciones de texto.

El resultado será cualquier documento que coincida con la consulta contenida en el índice de búsqueda. Los documentos, con incrustaciones que contienen campos vectoriales, deben existir en el índice de búsqueda y se debe usar el mismo modelo para la indexación y la consulta.

Insertar espacio

El espacio de inserción es el núcleo de las consultas vectoriales que incluyen todos los campos vectoriales del mismo modelo de inserción. Consta de todos los campos vectoriales rellenados con el mismo modelo.

En este espacio de inserción, los elementos similares se encuentran cerca y los elementos disimilares se encuentran más lejos.

Por ejemplo, los documentos que hablan de hoteles con un parque acuático estarían cerca en el espacio de inserción, mientras que los hoteles sin esta instalación estarían más lejos mientras que todavía se encuentra en el vecindario para hoteles. Los conceptos disimilares, como los restaurantes, se alejarían aún más. En la práctica, los espacios de inserción son abstractos y no tienen significados bien definidos que sean personas, pero la idea principal permanece igual.