Lección 3 15 min

El ciclo ReAct: cómo piensa y actúa un agente

El patrón ReAct (Razonamiento + Acción) — el loop Pensamiento → Acción → Observación que usan los agentes de IA para resolver tareas complejas sin alucinar.

Contenido de Curso Premium

Esta lección es parte de un curso premium. Mejora a Pro para desbloquear todos los cursos premium y su contenido.

Acceso a todos los cursos premium
Más de 1000 plantillas de skills de IA incluidas
Contenido nuevo cada semana

← Volver al curso

🔄 En la lección 2 vimos los 4 componentes de un agente — modelo, herramientas, memoria y orquestador. Ahora vamos al patrón que define cómo el orquestador realmente funciona.

El problema: alucinaciones

Si le preguntas a un modelo “¿Cuánto costó el vuelo más barato a Bogotá la semana pasada?”, puede inventar un precio que suene razonable. No tiene acceso a datos reales. Está alucinando.

ReAct soluciona esto forzando al agente a verificar antes de responder.

ReAct: Razonamiento + Acción

ReAct (Reasoning + Acting) es el patrón más usado en agentes de IA. Fue propuesto por investigadores de Princeton y Google en 2022, y hoy es la base de Claude, GPT-4 y la mayoría de frameworks agénticos.

El ciclo tiene 3 pasos que se repiten:

┌──────────────────────┐
│  PENSAMIENTO         │ ← El agente razona en lenguaje natural
│  "Necesito buscar    │
│   vuelos a Bogotá"   │
└──────────┬───────────┘
           ↓
┌──────────────────────┐
│  ACCIÓN              │ ← Ejecuta una herramienta
│  buscar_vuelos(      │
│    destino="Bogotá", │
│    fecha="semana     │
│    pasada")          │
└──────────┬───────────┘
           ↓
┌──────────────────────┐
│  OBSERVACIÓN         │ ← Recibe el resultado real
│  "Vuelo más barato:  │
│   $189 USD, Avianca" │
└──────────┬───────────┘
           ↓
     ¿Tarea completa?
     Sí → Responder
     No → Volver a Pensamiento

Ejemplo paso a paso

Tarea: “Encuentra el proveedor de hosting más barato para una tienda Shopify en Colombia.”

PENSAMIENTO 1: Necesito buscar opciones de hosting para Shopify en Colombia.
ACCIÓN 1: buscar_web("hosting Shopify Colombia precios 2026")
OBSERVACIÓN 1: Resultados: Cloudways $14/mes, SiteGround $17/mes,
               DigitalOcean $12/mes, GoDaddy $20/mes

PENSAMIENTO 2: Tengo precios, pero necesito verificar cuáles soportan
               Shopify específicamente y tienen servidores en LATAM.
ACCIÓN 2: buscar_web("Cloudways Shopify compatibilidad servidor LATAM")
OBSERVACIÓN 2: Cloudways soporta Shopify con servidores en São Paulo.

PENSAMIENTO 3: DigitalOcean es más barato ($12), verifico compatibilidad.
ACCIÓN 3: buscar_web("DigitalOcean Shopify hosting Colombia")
OBSERVACIÓN 3: DigitalOcean no ofrece hosting Shopify gestionado.

PENSAMIENTO 4: Descarto DigitalOcean. Cloudways $14/mes es el más barato
               con soporte real para Shopify y servidor cercano a Colombia.

RESPUESTA FINAL: El hosting más económico para Shopify en Colombia es
Cloudways a $14/mes, con servidores en São Paulo (baja latencia para LATAM).

Cuatro ciclos. Cada observación corrige el razonamiento. Sin ReAct, el agente habría respondido con el primer precio que encontró — o peor, habría inventado uno.

✅ Quick Check: En el ejemplo anterior, ¿qué habría pasado si el agente hubiera respondido directamente sin usar herramientas? (Probablemente habría inventado precios o recomendado opciones desactualizadas. ReAct fuerza la verificación con datos reales.)

Por qué funciona

Anclaje en datos reales: Cada paso de Observación trae información verificable. El agente no puede inventar lo que recibe de una herramienta.

Razonamiento transparente: Los pasos de Pensamiento son “pensar en voz alta”. Puedes ver la lógica del agente y detectar errores en su razonamiento.

Autocorrección: Si la Observación contradice el Pensamiento, el agente puede corregir su rumbo. En el ejemplo, descartó DigitalOcean cuando los datos mostraron que no soportaba Shopify.

Otros patrones agénticos

ReAct no es el único patrón. Estos son los más comunes:

Patrón	Cómo funciona	Cuándo usarlo
ReAct	Pensar → Actuar → Observar → Repetir	Tareas de investigación, análisis, resolución de problemas
Reflexión	El agente evalúa críticamente su propio output	Redacción, código, contenido creativo
Planificación	Crear plan completo primero, luego ejecutar	Tareas largas con pasos paralelos
Multi-agente	Varios agentes especializados colaborando	Tareas complejas con subtareas distintas

Reflexión convierte al agente de “generador” a “autocorrector”. Después de generar código, por ejemplo, el agente lo revisa buscando bugs antes de entregarlo.

Planificación (Plan-then-Execute) crea un plan completo antes de actuar. Útil cuando puedes ejecutar subtareas en paralelo, pero rígido si el plan necesita cambiar a mitad de camino.

La lección 6 profundiza en el patrón multi-agente.

Cuándo NO usar ReAct

ReAct añade pasos — más tokens, más tiempo, más costo. No siempre vale la pena:

Preguntas simples: “¿Cuál es la capital de Francia?” → Respuesta directa, sin herramientas.
Tareas creativas puras: “Escríbeme un poema sobre el café.” → No necesita buscar datos.
Conversación casual: “Hola, ¿cómo estás?” → Un loop agéntico sería absurdo aquí.

Usa ReAct cuando la tarea requiere información externa, verificación de datos o múltiples pasos.

✅ Quick Check: ¿Cuál es la diferencia entre el patrón ReAct y el de Reflexión? (ReAct usa herramientas externas para verificar datos. Reflexión hace que el agente evalúe críticamente su propia respuesta antes de entregarla. Se pueden combinar.)

Puntos clave

ReAct alterna: Pensamiento → Acción → Observación → Repetir
Reduce alucinaciones al forzar verificación contra datos reales
El razonamiento es transparente — puedes ver la lógica del agente
Otros patrones: Reflexión (autocrítica), Planificación (plan primero), Multi-agente (equipos)
No uses ReAct para preguntas simples — agrega costo innecesario

Siguiente lección

ReAct depende de herramientas para funcionar. En la lección 4 vamos a profundizar en herramientas y tool use: cómo el agente decide qué herramienta usar, function calling, y el rol de MCP como estándar universal.

Comprobación de Conocimientos

1. ¿Cuáles son los tres pasos del ciclo ReAct?

Planificar → Ejecutar → Reportar Pensamiento → Acción → Observación Buscar → Filtrar → Responder

2. ¿Por qué ReAct reduce las alucinaciones?

Porque usa un modelo más grande Porque fuerza al agente a verificar su razonamiento contra datos reales de herramientas antes de responder Porque limita la longitud de la respuesta

3. ¿Cuándo NO conviene usar ReAct?

Para tareas que requieren varias fuentes de información Para preguntas simples que el modelo puede responder directamente sin herramientas Para tareas que requieren precisión

Responde todas las preguntas para comprobar

Primero completa el quiz de arriba

Skills Relacionados

Diseñador de Cadenas de Razonamiento Diseñador de Agentes IA