Fundamentos de Prompt Engineering que debes conocer • Hablemos de Frontend

En el nuevo stack de desarrollo el Prompt Engineering no es magia, es diseñar instrucciones claras, contextuales y eficientes para obtener resultados útiles.

Si estás empezando o quieres ordenar conceptos, aquí tienes una guía simple para empezar.

1. ¿Qué es realmente un prompt?

Un prompt es la instrucción que le das a un modelo de lenguaje (LLM). Pero no es solo una pregunta: es contexto + intención + formato esperado.

Estructura base de un prompt

Los mejores prompts se construyen sobre 4 componentes clave:

Rol → Establece la personalidad y expertise del modelo. Ej: “eres un consultor de marca para pequeñas cafeterías”
Enfoque → Describe la tarea específica a realizar. Ej: “redacta una campaña de lanzamiento para un café de especialidad”
Límites → Fija restricciones operacionales como largo, tono, formato. Ej: “máximo 120 palabras, tono cercano y optimista”
Contexto (memoria) → Aporta detalles del proyecto para personalizar la respuesta. Ej: “la cafetería está en Barranco, público entre 20 y 35 años”

Ejemplo práctico:

Como especialista en comunicación para negocios gastronómicos
Crea un texto para anunciar el menú de invierno en Instagram
Máximo 90 palabras, lenguaje cálido, sin tecnicismos
Para un restaurante familiar en Cusco, platos andinos, público local y turistas

2. ¿Qué es un LLM?

Un LLM (Large Language Model) es un sistema de IA basado en redes neuronales que ha sido entrenada a partir de masivas cantidades de datos.

No razona como una persona. Funciona con estadística: estima qué palabra tiene más probabilidad de aparecer después.

Por eso, cuando le das buenas instrucciones, te responde de forma útil y coherente.

3. ¿Qué son embeddings?

Los embeddings transforman palabras y textos en coordenadas numéricas en un espacio multidimensional.

Esto posibilita:

comparar cuán similar es un concepto a otro
realizar búsquedas que entienden significado, no solo palabras clave
vincular IA con bases de datos tradicionales

Ejemplo:

“gato” y “gatito” → posiciones muy próximas en el espacio
“gato” y “motoneta” → posiciones muy distantes

4. El rol: la personalidad del modelo

Asignar un rol específico transforma la calidad y perspectiva de lo que recibes.

Eres un diseñador UX con 8 años en startups...
Eres un periodista de tecnología investigativo...
Eres un QA tester exhaustivo buscando bugs...

💡 El rol impacta directamente en:

el tipo de lenguaje que usa
el nivel de detalle de las respuestas
la perspectiva desde la que aborda el problema

5. Zero-shot vs Few-shot

Zero-shot

No proporcionas ejemplos previos.

Convierte este párrafo en un titular: "En 2026, el AI adoptó un enfoque más pragmático"

Few-shot

Incluyes patrones de ejemplo para que la IA replique el estilo.

Párrafo: "Las startups aceleran transformación" → Titular: "Startups aceleran su transformación digital"
Párrafo: "El código ahora es más legible" → Titular: "Código más legible y mantenible"
Párrafo: "Los equipos colaboran mejor" → Titular:

💡 Few-shot es superior cuando:

necesitas un formato o estilo muy específico
la tarea es interpretable de múltiples formas

6. Etiquetas XML: estructura semántica

Las etiquetas delimitadas ayudan al modelo a diferenciar secciones sin ambigüedad:


Como una escritora profesional.
Redacta una biografia en 120 palabras.
Incluye la siguiente información:

<datos_entrada>
<perfil>
  <nombre_completo>Lucia Fernandez</nombre_completo>
  <profesion>Disenadora de experiencia de usuario</profesion>
  <ciudad>Lima</ciudad>
</perfil>

<trayectoria>
  Lidero proyectos de rediseno en fintech y edtech.
  Ha trabajado con equipos multidisciplinarios en producto digital.
  Dicta talleres de diseno centrado en el usuario.
</trayectoria>

<fecha_nacimiento>1992-08-14</fecha_nacimiento>
</datos_entrada>

Beneficios:

reduce la ambigüedad contextual
facilita que el modelo procese más eficientemente
hace el prompt más robusto ante modelos diferentes

7. Ventana de contexto

Es el “espacio de memoria” disponible en una sola conversación con el modelo.

Incluye:

el prompt que envías
el historial de mensajes anteriores
la respuesta generada

💡 Cuando te acercas al límite:

información inicial se “olvida”
respuestas se vuelven más cortas o imprecisas
tokens restantes se agotan

8. Tokens

Los LLMs dividen el texto en fragmentos llamados tokens (no son palabras literales).

Ejemplo:

“JavaScript” → posiblemente 1 token
“internacionalización” → más de 1 token

Importa porque:

define cuánto “espacio” consume tu prompt
impacta directamente en costos si usas APIs pagas
determina cómo el modelo procesa largos documentos

9. Grounding

Es suministrarle información verificada para que toda respuesta se base unicamente en dicha información.

Ejemplo:

Usando SOLO la información del documento adjunto:
[documento]

Responde: ¿Cuáles son las 3 necesidades clave?
Si no existe, mencionar que dicha información no está disponible en el documento.

10. Chain of Thought & Self-Consistency

** Chain of Thought (CoT)**

Pides que el modelo razone explícitamente paso a paso para revisar el proceso que realizó para dar la respuesta.

Resuelve: 45 * 12 + 8 - 3
Muestra todos los pasos del cálculo.

Self-consistency

Ejecutas el mismo prompt varias veces y eliges la respuesta que más se repite entre los resultados obtenidos.

💡 Útil para:

problemas lógicos con múltiples soluciones
cálculos complejos
decisiones donde necesitas confianza alta

11. Prompt Chaining

En lugar de pedir todo en un prompt, fragmenta el trabajo en etapas conectadas:

Fase 1: Extrae información clave del documento
Fase 2: Reorganiza esa info en estructura
Fase 3: Genera conclusiones basadas en lo anterior

💡 Es más preciso que intentar “resolver todo de una”.

12. Temperatura y Top-P: control de variabilidad

Dos parámetros que manejan cuánta “libertad creativa” tiene el modelo.

Temperatura

más cerca a 0 → repetible, determinista (mismo input = mismo output siempre)
más cerca a 1 → más variación y sorpresas

Top-P

controla el universo de palabras al que el modelo puede acceder para construir su respuesta.

💡 Regla simple:

Top P bajo: el modelo usa las palabras más probables.
Top P alto: accede a un vocabulario más amplio.

13. Evaluar respuestas

No basta con “suena bien”, la información final debe ser revisada, puedes usar estas preguntas:

¿Los hechos, datos o código son correctos y verificables?
¿Responde el prompt exactamente, sin desviaciones?
¿El razonamiento fluye coherentemente?
¿Está completa o le faltan partes esenciales?

Ideas clave para cerrar

Un prompt mal diseñado = resultado mediocre
La claridad gana a la complejidad
Divide problemas grandes en prompts encadenados
Da contexto siempre que puedas
Iterar es parte del proceso