Herramientas y Tool Use: los brazos del agente
Cómo los agentes de IA usan herramientas — function calling, tool schemas, MCP como estándar universal, y las herramientas más usadas en LATAM.
Contenido de Curso Premium
Esta lección es parte de un curso premium. Mejora a Pro para desbloquear todos los cursos premium y su contenido.
- Acceso a todos los cursos premium
- Más de 1000 plantillas de skills de IA incluidas
- Contenido nuevo cada semana
🔄 En la lección 3 vimos el ciclo ReAct: Pensar → Actuar → Observar. El paso de “Actuar” depende completamente de las herramientas. Sin ellas, el agente solo puede pensar.
Function calling: la mecánica
Cuando un agente “usa una herramienta”, no ejecuta código directamente. Lo que hace es pedir que alguien más lo ejecute.
1. El modelo recibe schemas de herramientas disponibles
→ "Tienes disponible: buscar_web(query), consultar_bd(sql), enviar_email(to, subject, body)"
2. El modelo decide qué necesita
→ "Necesito buscar_web(query='precios hosting Colombia 2026')"
3. La aplicación ejecuta la función real
→ Llama a la API de Brave Search, recibe resultados
4. La aplicación envuelve el resultado y se lo devuelve al modelo
→ "Resultados: Cloudways $14/mes, SiteGround $17/mes..."
5. El modelo procesa y decide el siguiente paso
Esto se llama function calling. Claude, GPT-4 y Gemini lo soportan nativamente. El modelo nunca tiene acceso directo a internet o a tu base de datos — siempre hay una capa intermedia que controla qué se ejecuta.
✅ Quick Check: ¿Por qué el modelo no ejecuta las herramientas directamente? (Por seguridad. La capa intermedia controla qué funciones están disponibles, valida los parámetros y puede rechazar llamadas peligrosas como DELETE en una base de datos.)
Las herramientas más usadas
Estas son las categorías que aparecen en la mayoría de agentes empresariales en LATAM:
Búsqueda web:
- Brave Search, Tavily, DuckDuckGo API
- Para información en tiempo real que el modelo no tiene
Ejecución de código:
- Python (cálculos, análisis de datos, gráficos)
- JavaScript/Node.js
- Comandos de terminal
APIs externas:
- CRM (HubSpot, Salesforce)
- WhatsApp Business API (dominante en LATAM)
- Google Calendar, Google Drive
- Sistemas ERP y contables
Bases de datos:
- SQL (PostgreSQL, MySQL)
- Bases vectoriales (Pinecone, Qdrant, pgvector)
- NoSQL (MongoDB, Redis)
Documentos:
- Lectura de PDFs, Excel, Word
- OCR para imágenes y escaneos
- Generación de reportes
Comunicación:
- Slack, Microsoft Teams
- Email (Gmail, Outlook)
- WhatsApp (por API)
MCP: el estándar universal
En el mundo sin estándar, cada combinación de “modelo + herramienta” requiere integración propia. 3 modelos × 5 herramientas = 15 integraciones.
MCP (Model Context Protocol) lo simplifica: cada herramienta crea un servidor MCP. Cualquier modelo compatible lo puede usar. 3 modelos + 5 herramientas = 8 implementaciones.
Sin MCP:
Claude → integración A → GitHub
Claude → integración B → Slack
GPT-4 → integración C → GitHub (¡diferente!)
GPT-4 → integración D → Slack (¡otra vez!)
Con MCP:
Claude ──┐
GPT-4 ──┤──→ GitHub MCP Server
Gemini ──┘
Claude ──┐
GPT-4 ──┤──→ Slack MCP Server
Gemini ──┘
Hoy hay 8,600+ servidores MCP disponibles. OpenAI, Google y Microsoft ya lo soportan. Es el estándar de la industria.
Diseñar el kit de herramientas
No le des 50 herramientas a tu agente. Más herramientas = más confusión, más tokens, respuestas más lentas.
Principio: Empieza con 3-5 herramientas que cubran tu caso de uso. Añade más solo cuando el agente las necesite.
Ejemplo — Agente de atención al cliente:
consultar_pedido(id)— Estado del pedidobuscar_cliente(email)— Información del clientecrear_ticket(descripcion)— Escalar problemaenviar_mensaje(canal, texto)— Responder al cliente
Cuatro herramientas. Cubren el 90% de las consultas. Si el agente encuentra un caso que no puede resolver con estas 4, escala a un humano.
✅ Quick Check: ¿Por qué es mala idea darle 50 herramientas a un agente? (Más herramientas = más schemas que procesar = más tokens consumidos = respuestas más lentas y mayor probabilidad de que el agente elija la herramienta incorrecta.)
Herramientas con parámetros
Las herramientas bien diseñadas tienen parámetros claros con tipos y descripciones:
# Herramienta bien diseñada
def consultar_ventas(
region: str, # "norte", "sur", "centro"
periodo: str, # "2026-01", "2026-Q1", "2025"
formato: str = "resumen" # "resumen", "detallado", "csv"
) -> str:
"""Consulta las ventas por región y periodo.
Devuelve un resumen con totales y comparación vs periodo anterior."""
El modelo lee los tipos (str), los valores posibles y el docstring para decidir qué parámetros enviar. Mientras más claros sean, mejores decisiones toma el agente.
Puntos clave
- Function calling: el modelo pide ejecutar funciones, la aplicación las ejecuta — el modelo nunca tiene acceso directo
- MCP estandariza la conexión: un servidor por herramienta, compatible con cualquier modelo
- Empieza con 3-5 herramientas — más no es mejor
- Herramientas bien diseñadas: tipos claros, descripciones útiles, parámetros validados
- WhatsApp Business API es dominante para agentes en LATAM
Siguiente lección
Las herramientas le dan acceso al mundo. Pero ¿cómo recuerda el agente lo que hizo ayer? En la lección 5 vamos a memoria y contexto — los tres niveles de memoria y cómo RAG le da al agente conocimiento que el modelo no tiene.
Comprobación de Conocimientos
Primero completa el quiz de arriba
¡Lección completada!