Fundamentos de Prompt Engineering que debes conocer
En el nuevo stack de desarrollo el Prompt Engineering no es magia, es diseñar instrucciones claras, contextuales y eficientes para obtener resultados útiles.
Si estás empezando o quieres ordenar conceptos, aquí tienes una guía simple para empezar.
1. ¿Qué es realmente un prompt?
Un prompt es la instrucción que le das a un modelo de lenguaje (LLM). Pero no es solo una pregunta: es contexto + intención + formato esperado.
Estructura base de un prompt
Los mejores prompts se construyen sobre 4 componentes clave:
- Rol → Establece la personalidad y expertise del modelo. Ej: “eres un consultor de marca para pequeñas cafeterías”
- Enfoque → Describe la tarea específica a realizar. Ej: “redacta una campaña de lanzamiento para un café de especialidad”
- Límites → Fija restricciones operacionales como largo, tono, formato. Ej: “máximo 120 palabras, tono cercano y optimista”
- Contexto (memoria) → Aporta detalles del proyecto para personalizar la respuesta. Ej: “la cafetería está en Barranco, público entre 20 y 35 años”
Ejemplo práctico:
Como especialista en comunicación para negocios gastronómicos
Crea un texto para anunciar el menú de invierno en Instagram
Máximo 90 palabras, lenguaje cálido, sin tecnicismos
Para un restaurante familiar en Cusco, platos andinos, público local y turistas
2. ¿Qué es un LLM?
Un LLM (Large Language Model) es un sistema de IA basado en redes neuronales que ha sido entrenada a partir de masivas cantidades de datos.
No razona como una persona. Funciona con estadística: estima qué palabra tiene más probabilidad de aparecer después.
Por eso, cuando le das buenas instrucciones, te responde de forma útil y coherente.
3. ¿Qué son embeddings?
Los embeddings transforman palabras y textos en coordenadas numéricas en un espacio multidimensional.
Esto posibilita:
- comparar cuán similar es un concepto a otro
- realizar búsquedas que entienden significado, no solo palabras clave
- vincular IA con bases de datos tradicionales
Ejemplo:
- “gato” y “gatito” → posiciones muy próximas en el espacio
- “gato” y “motoneta” → posiciones muy distantes
4. El rol: la personalidad del modelo
Asignar un rol específico transforma la calidad y perspectiva de lo que recibes.
Eres un diseñador UX con 8 años en startups...
Eres un periodista de tecnología investigativo...
Eres un QA tester exhaustivo buscando bugs...
💡 El rol impacta directamente en:
- el tipo de lenguaje que usa
- el nivel de detalle de las respuestas
- la perspectiva desde la que aborda el problema
5. Zero-shot vs Few-shot
Zero-shot
No proporcionas ejemplos previos.
Convierte este párrafo en un titular: "En 2026, el AI adoptó un enfoque más pragmático"
Few-shot
Incluyes patrones de ejemplo para que la IA replique el estilo.
Párrafo: "Las startups aceleran transformación" → Titular: "Startups aceleran su transformación digital"
Párrafo: "El código ahora es más legible" → Titular: "Código más legible y mantenible"
Párrafo: "Los equipos colaboran mejor" → Titular:
💡 Few-shot es superior cuando:
- necesitas un formato o estilo muy específico
- la tarea es interpretable de múltiples formas
6. Etiquetas XML: estructura semántica
Las etiquetas delimitadas ayudan al modelo a diferenciar secciones sin ambigüedad:
Como una escritora profesional.
Redacta una biografia en 120 palabras.
Incluye la siguiente información:
<datos_entrada>
<perfil>
<nombre_completo>Lucia Fernandez</nombre_completo>
<profesion>Disenadora de experiencia de usuario</profesion>
<ciudad>Lima</ciudad>
</perfil>
<trayectoria>
Lidero proyectos de rediseno en fintech y edtech.
Ha trabajado con equipos multidisciplinarios en producto digital.
Dicta talleres de diseno centrado en el usuario.
</trayectoria>
<fecha_nacimiento>1992-08-14</fecha_nacimiento>
</datos_entrada>
Beneficios:
- reduce la ambigüedad contextual
- facilita que el modelo procese más eficientemente
- hace el prompt más robusto ante modelos diferentes
7. Ventana de contexto
Es el “espacio de memoria” disponible en una sola conversación con el modelo.
Incluye:
- el prompt que envías
- el historial de mensajes anteriores
- la respuesta generada
💡 Cuando te acercas al límite:
- información inicial se “olvida”
- respuestas se vuelven más cortas o imprecisas
- tokens restantes se agotan
8. Tokens
Los LLMs dividen el texto en fragmentos llamados tokens (no son palabras literales).
Ejemplo:
- “JavaScript” → posiblemente 1 token
- “internacionalización” → más de 1 token
Importa porque:
- define cuánto “espacio” consume tu prompt
- impacta directamente en costos si usas APIs pagas
- determina cómo el modelo procesa largos documentos
9. Grounding
Es suministrarle información verificada para que toda respuesta se base unicamente en dicha información.
Ejemplo:
Usando SOLO la información del documento adjunto:
[documento]
Responde: ¿Cuáles son las 3 necesidades clave?
Si no existe, mencionar que dicha información no está disponible en el documento.
10. Chain of Thought & Self-Consistency
** Chain of Thought (CoT)**
Pides que el modelo razone explícitamente paso a paso para revisar el proceso que realizó para dar la respuesta.
Resuelve: 45 * 12 + 8 - 3
Muestra todos los pasos del cálculo.
Self-consistency
Ejecutas el mismo prompt varias veces y eliges la respuesta que más se repite entre los resultados obtenidos.
💡 Útil para:
- problemas lógicos con múltiples soluciones
- cálculos complejos
- decisiones donde necesitas confianza alta
11. Prompt Chaining
En lugar de pedir todo en un prompt, fragmenta el trabajo en etapas conectadas:
- Fase 1: Extrae información clave del documento
- Fase 2: Reorganiza esa info en estructura
- Fase 3: Genera conclusiones basadas en lo anterior
💡 Es más preciso que intentar “resolver todo de una”.
12. Temperatura y Top-P: control de variabilidad
Dos parámetros que manejan cuánta “libertad creativa” tiene el modelo.
Temperatura
- más cerca a 0 → repetible, determinista (mismo input = mismo output siempre)
- más cerca a 1 → más variación y sorpresas
Top-P
controla el universo de palabras al que el modelo puede acceder para construir su respuesta.
💡 Regla simple:
- Top P bajo: el modelo usa las palabras más probables.
- Top P alto: accede a un vocabulario más amplio.
13. Evaluar respuestas
No basta con “suena bien”, la información final debe ser revisada, puedes usar estas preguntas:
- ¿Los hechos, datos o código son correctos y verificables?
- ¿Responde el prompt exactamente, sin desviaciones?
- ¿El razonamiento fluye coherentemente?
- ¿Está completa o le faltan partes esenciales?
Ideas clave para cerrar
- Un prompt mal diseñado = resultado mediocre
- La claridad gana a la complejidad
- Divide problemas grandes en prompts encadenados
- Da contexto siempre que puedas
- Iterar es parte del proceso