Comprenda las solicitudes para mejorar la calidad de finalización
La construcción de la solicitud puede ser difícil. En la práctica, la solicitud actúa para configurar los pesos del modelo para completar la tarea deseada, pero es más un arte que una ciencia y, a menudo, requiere experiencia e intuición para crear una solicitud que tenga éxito.
Cuando se envían solicitudes bien construidas al modelo, el modelo devuelve mejores finalizaciones.
En nuestro bot de recomendaciones relacionadas con senderismo, una gran solicitud del sistema ayuda al modelo a prepararse para recomendar las caminatas adecuadas. Y unas buenas solicitudes por parte del usuario refinan las recomendaciones que devuelve el modelo.
En esta unidad, hablamos de los conceptos y patrones generales que se pueden usar para generar solicitudes y examinar algunas técnicas que se pueden usar para mejorar la calidad de las finalizaciones.
Aspectos básicos
Las solicitudes de texto son cómo interactúan los usuarios con los modelos GPT. Los modelos de lenguaje generativos tratan de generar la serie de palabras que es más probable que prosigan al texto previo. Por ejemplo: ¿Qué es lo primero que se te viene a la mente cuando digo <solicitud>?
A medida que desarrolle solicitudes más complejas, es útil tener en cuenta este comportamiento fundamental. Independientemente de la solicitud, el modelo simplemente responde con lo que determina que es más probable que prosiga a partir de la solicitud.
Componentes de la solicitud
Al usar la API de finalización no existe diferencia entre las distintas partes de la solicitud, pero sigue siendo útil diseccionar la solicitud, ya que el objetivo es pensar en su construcción.
Instrucciones
Es probable que las instrucciones sean el componente de solicitud más usado. Son la parte de la solicitud que indica al modelo qué hacer y pueden variar de simples a complejas. Por ejemplo, Recomendar caminatas o Usted es un entusiasta del senderismo que ayuda a la gente a descubrir caminatas divertidas en su área. Es entusiasta y amable. Se presenta cuando saluda por primera vez. Al ayudar a las personas, siempre les pregunta dónde se encuentran y la dificultad de caminata deseada para hacer una recomendación.
Contenido principal
El contenido principal hace referencia a algún tipo de texto que el modelo procesa o transforma. Se usa normalmente junto con instrucciones. Por ejemplo, Proporcionará tres sugerencias para caminatas cercanas que varían de distancia tras obtener esa información.
El contenido principal puede ser mucho más largo, como por ejemplo, pedir al modelo que resuma un artículo de Wikipedia.
Ejemplos
Las indicaciones exitosas a menudo se basan en las prácticas de aprendizaje de "one-shot" o "few-shot". Esto hace referencia a la inclusión de uno o varios ejemplos del comportamiento deseado del modelo, normalmente mediante la inclusión de pares de entrada y salida. Esto no es aprendizaje en el sentido de que el modelo se cambie permanentemente, sino que los ejemplos condicionen al modelo para que responda según lo deseado solo para la inferencia actual.
El uso de solicitudes sin ejemplos a veces se denomina aprendizaje “zero-shot”.
Hike request: I live near Seattle and would like an easy hike.
Recommendation: That's great to hear, the Seattle area has some of the best hikes in the nation! You should try Little Si, you'll love it.
Hike request: I want to go on a hike in the North Cascades that will blow my mind.
Recommendation: You won't find a bad hike in the North Cascades. However, I hear the Sahale Arm stops people in their tracks with its beauty.
Hike request: I'd like to find a strenuous hike that's just like the Enchantments, but without as many people.
Recommendation:
Pila
Las señales actúan como el "punto de partida" para la salida del modelo, lo que ayuda a dirigir el modelo hacia la salida deseada. Es un prefijo al que el modelo suele tomar de referencia. Un indicador puede dirigir la finalización para incluir elementos clave. Se utilizan a menudo con instrucciones.
En el ejemplo siguiente se muestra un único indicador para resumir muchas reseñas de rutas.
Prompt | Completion |
---|---|
Las revisiones de rutas son una consideración importante para saber si los excursionistas van a seguir esa ruta de senderismo ya que la reseña enumera sus condiciones. [...] Resumen de la reseña anterior de las rutas: Las conclusiones son: |
que la ruta Mailbox Peak ahora mismo está embarrada y hay muchos mosquitos una vez pasados los árboles. También está muy concurrida a media mañana. |
Contenido adicional
El contenido auxiliar es información que el modelo puede usar para influir en la salida de alguna manera. Difiere del contenido principal en que no es el destino principal o la tarea principal, pero normalmente se usa junto con el contenido principal. Entre los ejemplos comunes se incluyen información contextual, como la fecha actual, el nombre del usuario, las preferencias del usuario, etc.
procedimientos recomendados
- Sé específico. Deja lo menos posible a la interpretación. Restringe el espacio operativo.
- Sé descriptivo. Usa analogías.
- Esfuérzate más. A veces es posible que tengas que repetirte al modelo. Proporciona instrucciones antes y después del contenido principal, usa una instrucción y una indicación, etc.
- El orden importa. El orden en el que se presente información al modelo puede afectar al resultado. Ya sea que coloques instrucciones antes de tu contenido ("resumir lo siguiente...") o después ("resumir lo anterior...") puede alterar el resultado. Incluso el orden de algunos ejemplos puede importar. Esta técnica se conoce como sesgo de actualidad.
- Preparar la salida. Incluya algunas palabras o frases al final de la solicitud para obtener una respuesta del modelo que siga el formulario deseado.
- Proporcione al modelo una "salida". A veces, puede resultar útil proporcionar al modelo una ruta de acceso alternativa si no puede completar la tarea asignada. Por ejemplo, al formular una pregunta sobre un fragmento de texto, podría incluir algo como "Responder con ‘no encontrado’ si no se encuentra respuesta". Esto podría ayudar al modelo a evitar generar respuestas falsas.
- Cadena de pensamientos. El modelo está programado para proceder paso a paso y mostrar todos los pasos llevados a cabo. Esto reduce la posibilidad de imprecisión de los resultados y facilita la evaluación de la respuesta del modelo.