El ciclo ReAct: cómo piensa y actúa un agente
El patrón ReAct (Razonamiento + Acción) — el loop Pensamiento → Acción → Observación que usan los agentes de IA para resolver tareas complejas sin alucinar.
Contenido de Curso Premium
Esta lección es parte de un curso premium. Mejora a Pro para desbloquear todos los cursos premium y su contenido.
- Acceso a todos los cursos premium
- Más de 1000 plantillas de skills de IA incluidas
- Contenido nuevo cada semana
🔄 En la lección 2 vimos los 4 componentes de un agente — modelo, herramientas, memoria y orquestador. Ahora vamos al patrón que define cómo el orquestador realmente funciona.
El problema: alucinaciones
Si le preguntas a un modelo “¿Cuánto costó el vuelo más barato a Bogotá la semana pasada?”, puede inventar un precio que suene razonable. No tiene acceso a datos reales. Está alucinando.
ReAct soluciona esto forzando al agente a verificar antes de responder.
ReAct: Razonamiento + Acción
ReAct (Reasoning + Acting) es el patrón más usado en agentes de IA. Fue propuesto por investigadores de Princeton y Google en 2022, y hoy es la base de Claude, GPT-4 y la mayoría de frameworks agénticos.
El ciclo tiene 3 pasos que se repiten:
┌──────────────────────┐
│ PENSAMIENTO │ ← El agente razona en lenguaje natural
│ "Necesito buscar │
│ vuelos a Bogotá" │
└──────────┬───────────┘
↓
┌──────────────────────┐
│ ACCIÓN │ ← Ejecuta una herramienta
│ buscar_vuelos( │
│ destino="Bogotá", │
│ fecha="semana │
│ pasada") │
└──────────┬───────────┘
↓
┌──────────────────────┐
│ OBSERVACIÓN │ ← Recibe el resultado real
│ "Vuelo más barato: │
│ $189 USD, Avianca" │
└──────────┬───────────┘
↓
¿Tarea completa?
Sí → Responder
No → Volver a Pensamiento
Ejemplo paso a paso
Tarea: “Encuentra el proveedor de hosting más barato para una tienda Shopify en Colombia.”
PENSAMIENTO 1: Necesito buscar opciones de hosting para Shopify en Colombia.
ACCIÓN 1: buscar_web("hosting Shopify Colombia precios 2026")
OBSERVACIÓN 1: Resultados: Cloudways $14/mes, SiteGround $17/mes,
DigitalOcean $12/mes, GoDaddy $20/mes
PENSAMIENTO 2: Tengo precios, pero necesito verificar cuáles soportan
Shopify específicamente y tienen servidores en LATAM.
ACCIÓN 2: buscar_web("Cloudways Shopify compatibilidad servidor LATAM")
OBSERVACIÓN 2: Cloudways soporta Shopify con servidores en São Paulo.
PENSAMIENTO 3: DigitalOcean es más barato ($12), verifico compatibilidad.
ACCIÓN 3: buscar_web("DigitalOcean Shopify hosting Colombia")
OBSERVACIÓN 3: DigitalOcean no ofrece hosting Shopify gestionado.
PENSAMIENTO 4: Descarto DigitalOcean. Cloudways $14/mes es el más barato
con soporte real para Shopify y servidor cercano a Colombia.
RESPUESTA FINAL: El hosting más económico para Shopify en Colombia es
Cloudways a $14/mes, con servidores en São Paulo (baja latencia para LATAM).
Cuatro ciclos. Cada observación corrige el razonamiento. Sin ReAct, el agente habría respondido con el primer precio que encontró — o peor, habría inventado uno.
✅ Quick Check: En el ejemplo anterior, ¿qué habría pasado si el agente hubiera respondido directamente sin usar herramientas? (Probablemente habría inventado precios o recomendado opciones desactualizadas. ReAct fuerza la verificación con datos reales.)
Por qué funciona
Anclaje en datos reales: Cada paso de Observación trae información verificable. El agente no puede inventar lo que recibe de una herramienta.
Razonamiento transparente: Los pasos de Pensamiento son “pensar en voz alta”. Puedes ver la lógica del agente y detectar errores en su razonamiento.
Autocorrección: Si la Observación contradice el Pensamiento, el agente puede corregir su rumbo. En el ejemplo, descartó DigitalOcean cuando los datos mostraron que no soportaba Shopify.
Otros patrones agénticos
ReAct no es el único patrón. Estos son los más comunes:
| Patrón | Cómo funciona | Cuándo usarlo |
|---|---|---|
| ReAct | Pensar → Actuar → Observar → Repetir | Tareas de investigación, análisis, resolución de problemas |
| Reflexión | El agente evalúa críticamente su propio output | Redacción, código, contenido creativo |
| Planificación | Crear plan completo primero, luego ejecutar | Tareas largas con pasos paralelos |
| Multi-agente | Varios agentes especializados colaborando | Tareas complejas con subtareas distintas |
Reflexión convierte al agente de “generador” a “autocorrector”. Después de generar código, por ejemplo, el agente lo revisa buscando bugs antes de entregarlo.
Planificación (Plan-then-Execute) crea un plan completo antes de actuar. Útil cuando puedes ejecutar subtareas en paralelo, pero rígido si el plan necesita cambiar a mitad de camino.
La lección 6 profundiza en el patrón multi-agente.
Cuándo NO usar ReAct
ReAct añade pasos — más tokens, más tiempo, más costo. No siempre vale la pena:
- Preguntas simples: “¿Cuál es la capital de Francia?” → Respuesta directa, sin herramientas.
- Tareas creativas puras: “Escríbeme un poema sobre el café.” → No necesita buscar datos.
- Conversación casual: “Hola, ¿cómo estás?” → Un loop agéntico sería absurdo aquí.
Usa ReAct cuando la tarea requiere información externa, verificación de datos o múltiples pasos.
✅ Quick Check: ¿Cuál es la diferencia entre el patrón ReAct y el de Reflexión? (ReAct usa herramientas externas para verificar datos. Reflexión hace que el agente evalúe críticamente su propia respuesta antes de entregarla. Se pueden combinar.)
Puntos clave
- ReAct alterna: Pensamiento → Acción → Observación → Repetir
- Reduce alucinaciones al forzar verificación contra datos reales
- El razonamiento es transparente — puedes ver la lógica del agente
- Otros patrones: Reflexión (autocrítica), Planificación (plan primero), Multi-agente (equipos)
- No uses ReAct para preguntas simples — agrega costo innecesario
Siguiente lección
ReAct depende de herramientas para funcionar. En la lección 4 vamos a profundizar en herramientas y tool use: cómo el agente decide qué herramienta usar, function calling, y el rol de MCP como estándar universal.
Comprobación de Conocimientos
Primero completa el quiz de arriba
¡Lección completada!