Técnicas de Prompt Engineering 1



El post se centra en estrategias y técnicas para maximizar la productividad utilizando modelos lingüísticos LLM como ChatGPT. Se hará hincapié en la comprensión de los fundamentos antes de sumergirse en las técnicas avanzadas.

LLM

Los LLM son los Large Language Models, es decir, son sistemas de inteligencia artificial que utilizan técnicas de aprendizaje profundo para comprender y generar texto. Transforman los datos en respuestas significativas.

Su eficacia depende en gran medida del contexto. Por ejemplo, el texto predictivo en los teléfonos utiliza modelos básicos, mientras que los LLM avanzados utilizan datos extensos para una mejor comprensión del contexto.

Conceptos Clave

Alignment: alineamiento entre intención y respuesta.

Alucinaciones: invenciones que hace la IA, pasa con problemas complejos. Hay que estar muy pendientes de las respuestas incorrectas o sin sentido.

 

Técnicas de Prompt Engineering como tal 

Empezaré con las más simples hasta llegar a las más complejas.

 

Técnica 0: Trigger Words o Palabras Desencadenantes

Controlamos el formato de las respuestas, especificamos cómo deseamos que se presente la información (por ejemplo, en listas, párrafos, etc.). Hay que utilizar palabras desencadenantes para influir en el comportamiento del modelo. Un esquema básico es el siguiente:

  • Te daré propina... (a veces hay que motivar al modelo como si fuese una persona, tienen algo de psicología humana incorporada).
  • Eres un experto en...
  • Si no lo haces bien... (escribir una consecuencia negativa).

En Dall-E usaremos superlativos, le pediremos una cosa y la iremos afinando con cada interacción.

Denominé este apartado como "técnica 0" porque esto mismo ya lo he desarrollado en el siguiente post: https://bergn.blogspot.com/2023/03/prompt-para-chatgpt.html

 

Técnica 1: Chain of Thought (CoT) o Cadena de Pensamiento

Esta técnica consiste en dividir problemas complejos en pasos secuenciales, lo que ayuda al modelo a generar respuestas más precisas. Está pensada para problemas de matemáticas y lógica, o cualquier tipo de consulta que requiera de pasos estructurados o de una planificación compleja.

  • Aplica CoT para resolver esto...
  • Primero..., luego..., finalmente...
  • Paso 1:
  • Paso 2:
  • Paso 3:
Si quieres darle más libertad al modelo y no limitar el potencial del modelo, puedes decirle: Qué pasos considerarías tomar para...


Técnica 2: Prompt Priming o Preparación del Prompt

Hay que establecer el contexto para el modelo, proporcionando instrucciones detalladas o escenarios, antes de formular las preguntas. Esto ayuda al modelo a comprender mejor la respuesta esperada. El objetivo es darle mucho contexto para acotar la respuesta lo máximo posible.

  • Tu objetivo es...
  • Supongamos que...
  • En el contexto de...
  • Considerando que...
  • Imagina que...
  • Asume que...


Técnica 3: One and Few Shots o Trabajar con Ejemplos

Estamos ante una de las técnicas más poderosas. Proporcionamos ejemplos para guiar las respuestas del modelo. Esto es especialmente útil para tareas complejas en las que el modelo puede necesitar un contexto adicional. Podemos dividirlos, según la cantidad de ejemplos utilizados, en dos:

One Shot

Se refiere a trabajar con un ejemplo.

  • Ayúdame a resolver [tarea complicada], en base a [ejemplo].
  • Desarrolla [tarea compleja] de acuerdo al siguiente ejemplo [ejemplo].
  • Sigue este ejemplo para completar las siguientes tareas...

Few Shots

Se refiere a trabajar con varios ejemplos. No es común ni eficiente usar esta técnica en prompts simples. Brindar documentos con estructuras o ejemplos puede considerarse few shot. Hay que señalar que esta técnica es cada vez menos necesaria, ya que los modelos se están afinando y mejorando todos los días.

 

Técnica 4: Tree of Thoughts (ToT) o Árbol de Pensamientos

Es un enfoque avanzado para resolver problemas complejos, y a diferencia de otras técnicas, permite la exploración de múltiples caminos de razonamiento, considerando varias opciones intermedias, y tomando decisiones para encontrar una mejor solución global. Esta estrategia se basa en procesos cognitivos humanos.

Se puede conseguir más información sobre esta técnica en el siguiente enlace: 

https://www.kmeleon.tech/learn/delving-into-tree-of-thoughts-prompting

Podemos subdividir esta estrategia en los siguientes pasos:

Figura 1

1. Input-Output Prompting (IQ)

Es un prompt sencillo en el que hacemos una pregunta y obtenemos una respuesta.

2. Chain of Thought Prompting (CoT) o Cadena de Pensamientos

Vamos evaluando y construyendo paso a paso la solución. 

3. Self Consistency with CoT (CoT-SC)

No se verá este contenido aquí, será desarrollado en otro post más específico. Lo que se puede adelantar es que opera como una anidación de varias estrategias.

4. Tree of Thoughts (ToT)

El modelo lo que hace es explorar varias opciones en varios niveles, y en base a una ciertos heurísticos (reglas basadas en la experiencia), que pueden ser planteados por el mismo modelo o por nosotros mismos, irá tomando decisiones en cuál opción es la mejor y, en teoría, esto podría tomar un camino no lineal, entrelazado, ramificado.

Empezamos con un número determinado de opciones en un primer nivel, el modelo evalúa esas opciones de acuerdo a los heurísticos y reglas aplicadas, construyendo más opciones, y a medida que construye estas últimas opciones, va tomando más decisiones. Este proceso se repite hasta que llega a una solución global.

Esta estrategia es muy avanzada, se puede aplicar en ChatGPT, pero hay que indicar que no aprovecha todo su potencial. Esto se debe a que este tipo de estrategias son muy visuales y ChatGPT solo es un chatbot, no podemos ver el proceso intermedio que él desarrolla y que nos puede dar ideas para ir alimentando la estrategia con más información intermedia, por lo que no podemos evaluar sus pasos y llegar a una solución óptima.

Sin embargo, dentro de ChatGPT hay personas que han desarrollado GPTs que emulan esta estrategia, puedes ir al buscador y poner Tree of Thoughts, recomiendo el desarrollado por Wai Cheung Wong, pero hay varios y por mi experiencia, todos son buenos.

 

Técnica 5: Visualization of Thought (VoT) o Visualización de Pensamientos

Es el mismo procedimiento que el Chain of Thought, pero antes de pasar al siguiente paso, vamos a visualizar cómo está la situación, a cómo está globalmente el problema, para ver si estamos avanzando en la buena dirección o tenemos que replantear el camino. Vemos el pensamiento, nos paramos a visualizar el problema, vamos a otro pensamiento, volvemos a visualizar el problema, y así sucesivamente hasta llegar a una solución final.

Figura 2

Se puede conseguir más información sobre esta técnica en el siguiente enlace:

https://neurips.cc/virtual/2024/poster/96156

Técnica 6: BIDARA, el prompt que usa la NASA

El propósito de este prompt es guiar a los usuarios a través del proceso de diseño biomimético, ayudándolos a entender y emular las estrategias utilizadas por los organismos naturales para crear soluciones sostenibles.

Hay que recalcar que se le asigna un nombre propio y se detiene en cada paso, para que de esa manera, trabajemos la IA y nosotros juntos en la solución.

Aquí te presento el prompt BIDARA: https://bergn.blogspot.com/2025/01/bidara-el-prompt-usado-por-la-nasa.html


* La imagen de portada es de Vicki Hamilton.  Thank you very much for your greatest job.

Comentarios

Entradas populares