Técnicas de Prompt Engineering 1
El post se centra en estrategias y técnicas para maximizar la productividad utilizando modelos lingüísticos LLM como ChatGPT. Se hará hincapié en la comprensión de los fundamentos antes de sumergirse en las técnicas avanzadas.
LLM
Los LLM son los Large Language Models, es decir, son
sistemas de inteligencia artificial que utilizan técnicas de aprendizaje
profundo para comprender y generar texto. Transforman los datos en respuestas
significativas.
Su eficacia depende en gran medida del contexto. Por
ejemplo, el texto predictivo en los teléfonos utiliza modelos básicos, mientras
que los LLM avanzados utilizan datos extensos para una mejor comprensión del
contexto.
Conceptos Clave
Alignment: alineamiento entre intención y respuesta.
Alucinaciones: invenciones que hace la IA, pasa con problemas complejos. Hay que estar muy pendientes de las respuestas incorrectas o sin sentido.
Técnicas de Prompt Engineering como tal
Empezaré con las más simples hasta llegar a las más
complejas.
Técnica 0: Trigger Words o Palabras Desencadenantes
Controlamos el formato de las respuestas, especificamos cómo deseamos que se presente la información (por ejemplo, en listas, párrafos, etc.). Hay que utilizar palabras desencadenantes para influir en el comportamiento del modelo. Un esquema básico es el siguiente:
- Te daré propina... (a veces hay que motivar al modelo como si fuese una persona, tienen algo de psicología humana incorporada).
- Eres un experto en...
- Si no lo haces bien... (escribir una consecuencia negativa).
En Dall-E usaremos superlativos, le pediremos una cosa y la iremos afinando con cada interacción.
Denominé este apartado como "técnica 0" porque esto mismo ya lo he desarrollado en el siguiente post: https://bergn.blogspot.com/2023/03/prompt-para-chatgpt.html
Técnica 1: Chain of Thought (CoT) o Cadena de Pensamiento
Esta técnica consiste en dividir problemas complejos en pasos secuenciales, lo que ayuda al modelo a generar respuestas más precisas. Está pensada para problemas de matemáticas y lógica, o cualquier tipo de consulta que requiera de pasos estructurados o de una planificación compleja.
- Aplica CoT para resolver esto...
- Primero..., luego..., finalmente...
- Paso 1:
- Paso 2:
- Paso 3:
Técnica 2: Prompt Priming o Preparación del Prompt
Hay que establecer el contexto para el modelo, proporcionando instrucciones detalladas o escenarios, antes de formular las preguntas. Esto ayuda al modelo a comprender mejor la respuesta esperada. El objetivo es darle mucho contexto para acotar la respuesta lo máximo posible.
- Tu objetivo es...
- Supongamos que...
- En el contexto de...
- Considerando que...
- Imagina que...
- Asume que...
Técnica 3: One and Few Shots o Trabajar con Ejemplos
Estamos ante una de las técnicas más poderosas. Proporcionamos
ejemplos para guiar las respuestas del modelo. Esto es especialmente útil para
tareas complejas en las que el modelo puede necesitar un contexto adicional.
Podemos dividirlos, según la cantidad de ejemplos utilizados, en dos:
One Shot
Se refiere a trabajar con un ejemplo.
- Ayúdame a resolver [tarea complicada], en base a [ejemplo].
- Desarrolla [tarea compleja] de acuerdo al siguiente ejemplo [ejemplo].
- Sigue este ejemplo para completar las siguientes tareas...
Few Shots
Se refiere a trabajar con varios ejemplos. No es común ni
eficiente usar esta técnica en prompts simples. Brindar documentos con
estructuras o ejemplos puede considerarse few shot. Hay que señalar que esta
técnica es cada vez menos necesaria, ya que los modelos se están afinando y
mejorando todos los días.
Técnica 4: Tree of Thoughts (ToT) o Árbol de Pensamientos
Es un enfoque avanzado para resolver problemas complejos, y
a diferencia de otras técnicas, permite la exploración de múltiples caminos de
razonamiento, considerando varias opciones intermedias, y tomando decisiones
para encontrar una mejor solución global. Esta estrategia se basa en procesos
cognitivos humanos.
Se puede conseguir más información sobre esta técnica en el siguiente enlace:
https://www.kmeleon.tech/learn/delving-into-tree-of-thoughts-prompting
Podemos subdividir esta estrategia en los siguientes pasos:
![]() |
Figura 1 |
1. Input-Output Prompting (IQ)
Es un prompt sencillo en el que hacemos una pregunta y
obtenemos una respuesta.
Vamos evaluando y construyendo paso a paso la solución.
3. Self Consistency with CoT (CoT-SC)
No se verá este contenido aquí, será desarrollado en otro
post más específico. Lo que se puede adelantar es que opera como una anidación
de varias estrategias.
4. Tree of Thoughts (ToT)
El modelo lo que hace es explorar varias opciones en varios
niveles, y en base a una ciertos heurísticos (reglas basadas en la experiencia),
que pueden ser planteados por el mismo modelo o por nosotros mismos, irá tomando
decisiones en cuál opción es la mejor y, en teoría, esto podría tomar un camino
no lineal, entrelazado, ramificado.
Empezamos con un número determinado de opciones en un primer
nivel, el modelo evalúa esas opciones de acuerdo a los heurísticos y reglas
aplicadas, construyendo más opciones, y a medida que construye estas últimas
opciones, va tomando más decisiones. Este proceso se repite hasta que llega a
una solución global.
Esta estrategia es muy avanzada, se puede aplicar en
ChatGPT, pero hay que indicar que no aprovecha todo su potencial. Esto se debe
a que este tipo de estrategias son muy visuales y ChatGPT solo es un chatbot,
no podemos ver el proceso intermedio que él desarrolla y que nos puede dar
ideas para ir alimentando la estrategia con más información intermedia, por lo
que no podemos evaluar sus pasos y llegar a una solución óptima.
Sin embargo, dentro de ChatGPT hay personas que han
desarrollado GPTs que emulan esta estrategia, puedes ir al buscador y poner Tree
of Thoughts, recomiendo el desarrollado por Wai Cheung Wong, pero hay varios y
por mi experiencia, todos son buenos.
Técnica 5: Visualization of Thought (VoT) o Visualización de Pensamientos
Es el mismo procedimiento que el Chain of Thought, pero antes de pasar al siguiente paso, vamos a visualizar cómo está la situación, a cómo está globalmente el problema, para ver si estamos avanzando en la buena dirección o tenemos que replantear el camino. Vemos el pensamiento, nos paramos a visualizar el problema, vamos a otro pensamiento, volvemos a visualizar el problema, y así sucesivamente hasta llegar a una solución final.
![]() |
Figura 2 |
Se puede conseguir más información sobre esta técnica en el siguiente enlace:
https://neurips.cc/virtual/2024/poster/96156
Técnica 6: BIDARA, el prompt que usa la NASA
El propósito de este prompt es guiar a los usuarios a través
del proceso de diseño biomimético, ayudándolos a entender y emular las estrategias
utilizadas por los organismos naturales para crear soluciones sostenibles.
Hay que recalcar que se le asigna un nombre propio y se
detiene en cada paso, para que de esa manera, trabajemos la IA y nosotros
juntos en la solución.
Aquí te presento el prompt BIDARA: https://bergn.blogspot.com/2025/01/bidara-el-prompt-usado-por-la-nasa.html
* La imagen de portada es de Vicki Hamilton. Thank you very much for your greatest job.
Comentarios