Lección 4 15 min

Herramientas y Tool Use: los brazos del agente

Cómo los agentes de IA usan herramientas — function calling, tool schemas, MCP como estándar universal, y las herramientas más usadas en LATAM.

Contenido de Curso Premium

Esta lección es parte de un curso premium. Mejora a Pro para desbloquear todos los cursos premium y su contenido.

Acceso a todos los cursos premium
Más de 1000 plantillas de skills de IA incluidas
Contenido nuevo cada semana

← Volver al curso

🔄 En la lección 3 vimos el ciclo ReAct: Pensar → Actuar → Observar. El paso de “Actuar” depende completamente de las herramientas. Sin ellas, el agente solo puede pensar.

Function calling: la mecánica

Cuando un agente “usa una herramienta”, no ejecuta código directamente. Lo que hace es pedir que alguien más lo ejecute.

1. El modelo recibe schemas de herramientas disponibles
   → "Tienes disponible: buscar_web(query), consultar_bd(sql), enviar_email(to, subject, body)"

2. El modelo decide qué necesita
   → "Necesito buscar_web(query='precios hosting Colombia 2026')"

3. La aplicación ejecuta la función real
   → Llama a la API de Brave Search, recibe resultados

4. La aplicación envuelve el resultado y se lo devuelve al modelo
   → "Resultados: Cloudways $14/mes, SiteGround $17/mes..."

5. El modelo procesa y decide el siguiente paso

Esto se llama function calling. Claude, GPT-4 y Gemini lo soportan nativamente. El modelo nunca tiene acceso directo a internet o a tu base de datos — siempre hay una capa intermedia que controla qué se ejecuta.

✅ Quick Check: ¿Por qué el modelo no ejecuta las herramientas directamente? (Por seguridad. La capa intermedia controla qué funciones están disponibles, valida los parámetros y puede rechazar llamadas peligrosas como DELETE en una base de datos.)

Las herramientas más usadas

Estas son las categorías que aparecen en la mayoría de agentes empresariales en LATAM:

Búsqueda web:

Brave Search, Tavily, DuckDuckGo API
Para información en tiempo real que el modelo no tiene

Ejecución de código:

Python (cálculos, análisis de datos, gráficos)
JavaScript/Node.js
Comandos de terminal

APIs externas:

CRM (HubSpot, Salesforce)
WhatsApp Business API (dominante en LATAM)
Google Calendar, Google Drive
Sistemas ERP y contables

Bases de datos:

SQL (PostgreSQL, MySQL)
Bases vectoriales (Pinecone, Qdrant, pgvector)
NoSQL (MongoDB, Redis)

Documentos:

Lectura de PDFs, Excel, Word
OCR para imágenes y escaneos
Generación de reportes

Comunicación:

Slack, Microsoft Teams
Email (Gmail, Outlook)
WhatsApp (por API)

MCP: el estándar universal

En el mundo sin estándar, cada combinación de “modelo + herramienta” requiere integración propia. 3 modelos × 5 herramientas = 15 integraciones.

MCP (Model Context Protocol) lo simplifica: cada herramienta crea un servidor MCP. Cualquier modelo compatible lo puede usar. 3 modelos + 5 herramientas = 8 implementaciones.

Sin MCP:
  Claude → integración A → GitHub
  Claude → integración B → Slack
  GPT-4  → integración C → GitHub  (¡diferente!)
  GPT-4  → integración D → Slack   (¡otra vez!)

Con MCP:
  Claude ──┐
  GPT-4  ──┤──→ GitHub MCP Server
  Gemini ──┘
  Claude ──┐
  GPT-4  ──┤──→ Slack MCP Server
  Gemini ──┘

Hoy hay 8,600+ servidores MCP disponibles. OpenAI, Google y Microsoft ya lo soportan. Es el estándar de la industria.

Diseñar el kit de herramientas

No le des 50 herramientas a tu agente. Más herramientas = más confusión, más tokens, respuestas más lentas.

Principio: Empieza con 3-5 herramientas que cubran tu caso de uso. Añade más solo cuando el agente las necesite.

Ejemplo — Agente de atención al cliente:

consultar_pedido(id) — Estado del pedido
buscar_cliente(email) — Información del cliente
crear_ticket(descripcion) — Escalar problema
enviar_mensaje(canal, texto) — Responder al cliente

Cuatro herramientas. Cubren el 90% de las consultas. Si el agente encuentra un caso que no puede resolver con estas 4, escala a un humano.

✅ Quick Check: ¿Por qué es mala idea darle 50 herramientas a un agente? (Más herramientas = más schemas que procesar = más tokens consumidos = respuestas más lentas y mayor probabilidad de que el agente elija la herramienta incorrecta.)

Herramientas con parámetros

Las herramientas bien diseñadas tienen parámetros claros con tipos y descripciones:

# Herramienta bien diseñada
def consultar_ventas(
    region: str,        # "norte", "sur", "centro"
    periodo: str,       # "2026-01", "2026-Q1", "2025"
    formato: str = "resumen"  # "resumen", "detallado", "csv"
) -> str:
    """Consulta las ventas por región y periodo.
    Devuelve un resumen con totales y comparación vs periodo anterior."""

El modelo lee los tipos (str), los valores posibles y el docstring para decidir qué parámetros enviar. Mientras más claros sean, mejores decisiones toma el agente.

Puntos clave

Function calling: el modelo pide ejecutar funciones, la aplicación las ejecuta — el modelo nunca tiene acceso directo
MCP estandariza la conexión: un servidor por herramienta, compatible con cualquier modelo
Empieza con 3-5 herramientas — más no es mejor
Herramientas bien diseñadas: tipos claros, descripciones útiles, parámetros validados
WhatsApp Business API es dominante para agentes en LATAM

Siguiente lección

Las herramientas le dan acceso al mundo. Pero ¿cómo recuerda el agente lo que hizo ayer? En la lección 5 vamos a memoria y contexto — los tres niveles de memoria y cómo RAG le da al agente conocimiento que el modelo no tiene.

Comprobación de Conocimientos

1. ¿Qué es 'function calling' en el contexto de agentes?

El agente ejecuta código Python directamente El modelo declara qué función necesita ejecutar, la aplicación la ejecuta y devuelve el resultado al modelo El usuario llama funciones manualmente desde la interfaz

2. ¿Cuál es el papel de MCP en el uso de herramientas por agentes?

MCP reemplaza function calling completamente MCP estandariza cómo se conectan herramientas a cualquier modelo de IA — un protocolo universal MCP solo funciona con Claude

3. ¿Qué tipo de herramienta usarías para que un agente responda preguntas sobre las políticas de devolución de tu empresa?

Búsqueda web (Brave Search, Tavily) Base de datos vectorial con RAG (documentos de la empresa) Ejecución de código Python

Responde todas las preguntas para comprobar

Primero completa el quiz de arriba

Skills Relacionados

Creador de Cadenas de Herramientas Escritor de Documentación de API