El 27 de mayo de 2026, Cognition AI cerró una ronda Serie D de más de 1.000 millones de dólares a una valoración de 26.000 millones, más del doble de los 10.200 millones que tenía hace nueve meses. La lideraron Lux Capital y General Catalyst, con 8VC como co-líder. Pero la cifra que se viralizó en Twitter en español esa noche no fue la valoración. Fue otra: el 89% de los pull requests internos de Cognition los abre ahora Devin — su propia IA.
Si lideras un equipo de diez ingenieros en España, México, Argentina, Colombia o Chile, lo más probable es que esta mañana te haya llegado un mensaje del CTO. O del CEO. O del responsable de presupuesto preguntando si la factura de IA del próximo trimestre ya está fuera de control.
Antes de responder, vale la pena leer esto.
Qué cambió realmente
Tres cosas aterrizaron en las últimas seis semanas que cambian la conversación:
Devin 2.0 (abril de 2026) — Cognition bajó el plan de entrada de 500 USD/mes a 20 USD/mes + 2,25 USD por Agent Compute Unit (ACU), donde una ACU equivale más o menos a 15 minutos de trabajo activo de Devin. Una corrección de bug típica usa 2-3 ACU. Una migración multi-fichero puede llegar a 30+. En la práctica: 4,50-6,75 USD por una corrección rutinaria, 67,50 USD en adelante para un refactor serio.
Claude Code Remote Tasks — La última actualización de Anthropic llevó la puntuación de SWE-Bench Verified a 87,6%, el mejor número público de mayo de 2026. Los precios no se movieron: Pro a 20 USD/mes, Max 5x a 100 USD/mes, Max 20x a 200 USD/mes. En uso real intensivo, la mayoría termina en 100-200 USD/mes.
El contra-relato de OpenHands — La publicación de @iam_elias1 del 23 de mayo en X (84 likes, 29 reposts) marcó el techo presupuestario: OpenHands (antes OpenDevin) combinado con el modo de pensamiento extendido de Claude Sonnet 4.5 saca 72% en SWE-Bench Verified con un coste de API de unos 6 USD/día en uso intensivo. Open source. Sandboxed en Docker. Sin vendor lock-in. La frase exacta del hilo: “Seis dólares al día en uso intensivo. Frente a 500 dólares al mes por Devin.”
La noticia es la valoración. La historia es la economía.
Los 4 tipos de ticket — y qué agente gana cada uno
La forma correcta de pensarlo no es por marca, sino por la forma del ticket. La promesa de Devin es autonomía: le pasas un issue de GitHub, desaparece varias horas, abre un PR. La promesa de Claude Code es pair programming en tiempo real: tú estás en la terminal, él hace el trabajo, tú firmas línea a línea. La respuesta correcta por ticket depende de si prefieres esperar o sentarte.
Ticket 1 — Test flaky que falla aleatoriamente
El clásico “este test ha fallado tres veces esta semana, no sabemos por qué.”
- Claude Code (en bucle): abres el fichero que falla. Le dices a Claude qué es flaky. Va trazando la race condition o la dependencia temporal delante de ti. Coste: unos 50 céntimos de USD de tu Max 5x. Tiempo real: 15-30 minutos.
- Devin (autónomo): asignas el issue a una sesión de Devin. Te vas. Corre la batería de tests, instrumenta el test, encuentra la fuente del flake, abre un PR. ACU: 2-3. Coste: 4,50-6,75 USD. Tiempo real: ~45 minutos desde tu punto de vista, pero no estuviste en la habitación.
Gana Claude Code, por coste y por aprendizaje. Tú aprendes qué era flaky. La próxima vez lo detectas más rápido.
Ticket 2 — Actualización de dependencias en 30 ficheros
El “necesitamos pasar React/Next/Express a la vN+1.” Mecánico. Muchos ficheros. Tedioso.
- Claude Code: lanzas el comando de upgrade. Arreglas los breakages a mano. Claude Code edita por lotes pero sigues haciendo de niñera. Coste: unos pocos dólares de suscripción. Tiempo real: 2-3 horas.
- Devin: entregas el issue con el objetivo de upgrade. Corre el upgrade, arregla los breakages, lanza la suite completa de tests, abre un PR. ACU: 15-25. Coste: ~50 USD. Tiempo real: 2-4 horas de Devin. Tú hiciste otra cosa.
Gana Devin, claramente. Es el “prefiero esperar a sentarme” de manual. 50 USD por tres horas de ingeniero senior recuperadas es un buen trato.
Ticket 3 — Construir un endpoint nuevo con 4 consumidores
El “necesitamos un POST /api/v2/foo y cuatro servicios tienen que llamarlo.”
- Claude Code: este probablemente quieras sentarte a hacerlo. Diseñar la forma del endpoint, la capa de auth, el manejo de errores, las cuatro integraciones de consumidores — eso es trabajo con forma de arquitectura, no mecánico. Claude Code es excelente aquí porque co-diseña contigo. Coste: unos dólares. Tiempo real: 2-3 horas.
- Devin: Devin lo diseñará. La salida probablemente funcione. Puede que no respete tus convenciones de servicio. Como dijo @morganlinton en X: “Ambos tienden a creer que han terminado el plan, pero quedan partes sin construir o bugs reales por arreglar.” ACU: 20-30. Coste: 50-70 USD.
Gana Claude Code, con un matiz. Devin gana si tu codebase es lo suficientemente uniforme como para que las convenciones de un agente externo encajen dentro de la tolerancia. Para la mayoría de equipos de diez ingenieros eso aún no es cierto.
Ticket 4 — Refactor multi-fichero (renombrar + cambio de firma en 80 call-sites)
- Claude Code: doloroso. O haces de niñera durante el rename, o usas una herramienta determinista de refactoring primero y dejas a Claude limpiar los edge cases. Coste: unos dólares de suscripción. Tiempo real: media jornada.
- Devin: lo entregas. ACU: 30-50. Coste: 70-115 USD. Tiempo real: media jornada de Devin. Tú hiciste otra cosa, otra vez.
Gana Devin, si tu cobertura de tests es honesta. El riesgo son regresiones silenciosas en call-sites cuyos tests no cubren el comportamiento cambiado — y ese riesgo es el mismo con cualquier herramienta, solo que aquí no estás viéndolo en tiempo real. Empareja Devin con una CI estricta.
La tabla honesta de costes para un equipo de diez ingenieros
Una semana típica — 4 tests flaky, 2 actualizaciones de dependencias, 3 endpoints nuevos, 1 refactor grande:
| Estrategia | Gasto Devin | Gasto Claude Code | Total mensual | Nota |
|---|---|---|---|---|
| Todo Devin | ~200 USD/sem en tickets + 20 USD base = ~820 USD/mes por dev × 10 = 8.200 USD | — | ~8.200 USD | La opción de la nota de prensa |
| Todo Claude Code | — | 200 USD/mes × 10 = 2.000 USD | 2.000 USD | Suscripción, sin sobrecoste por ticket |
| Híbrido (Devin para #2 + #4; Claude Code para #1 + #3) | ~300 USD/mes por dev × 10 = 3.000 USD | 200 USD/mes × 10 = 2.000 USD | 5.000 USD | El stack real que usa @ryancarson — Devin para agentes de backend/cloud, Claude Code o Codex para frontend/local |
| OpenHands + Claude Sonnet 4.5 API | — | ~6 USD/día × 22 días laborables × 10 devs = 1.320 USD | 1.320 USD | El suelo presupuestario de @iam_elias1 |
Las cifras son ilustrativas. Las matemáticas son reales. El stack híbrido se queda en 5.000 USD/mes para el equipo — frente a 8.200 si vas todo-Devin, frente a 1.320 si vas todo-open-source. La pregunta que debe hacerse cada engineering manager tras la ronda: "¿en qué tickets los 3.200 USD/mes extra de Devin realmente me compran tres horas de ingeniero senior?" La respuesta suele ser los #2 y #4. Casi siempre.
Qué significa esto para ti
- Si lideras un equipo de 5-15 ingenieros: híbrido. Devin para tickets con forma de #2 y #4 (mecánicos, multi-fichero, “prefiero esperar a sentarme”). Claude Code en Max 5x o Max 20x para #1 y #3 (juicio, arquitectura, “deberías sentarte”). Presupuesta unos 4-5 K USD/mes para el equipo.
- Si lideras un equipo de 50+ ingenieros: la matemática por puesto de Devin mejora a escala porque dominan los tickets autónomos. Habla con Cognition sobre precios enterprise — los 20 USD de entrada fueron la jugada de consumo; los clientes serios negocian.
- Si eres dev en solitario o equipo de 2-3: Claude Code Pro o Max 5x cubre el 80% de lo que necesitas. La estructura de ACU de Devin está diseñada para tickets de horas; los devs en solitario rara vez los tienen.
- Si tu empresa exige open source o “sin vendor lock-in”: OpenHands + API de Sonnet 4.5. El 72% de SWE-Bench es real, el sandbox de Docker es real, y los ~6 USD/día con uso intensivo son genuinamente más baratos que cualquier suscripción. El coste lo pagas con tu fin de semana, porque nada viene listo.
- Si estás en una industria regulada (banca, seguros, sanidad, gobierno): Devin ganó las cuentas de Citi, Goldman Sachs y el Ejército y la Marina de EE. UU. por una razón — su enfoque de cumplimiento está pensado para ese comprador. Claude Code en plan enterprise con el contrato Anthropic-empresa te lleva a un sitio parecido. OpenHands no.
Lo que no arregla
Los límites honestos, antes de cambiar tu stack:
- Ningún agente elimina la necesidad de code review. Que Devin abra el 89% de los PRs en Cognition no significa que la empresa revise el 11% de forma rigurosa. Significa que una persona sigue sentada con cada uno. La tuya también.
- “Probé Devin hace un año y era basura” ya no aplica. Como dijo @nityasnotes (Exa): “Si probaste Devin cuando salió, te aviso que hoy es un producto totalmente distinto.” La reputación de 2024 no coincide con el producto de 2026. Vuelve a probarlo antes de decidir.
- El consumo de ACU es impredecible hasta que lo has medido durante dos semanas. Un “bug simple” puede convertirse en 12 ACU porque tu suite de tests es lenta. Mide coste por ticket en los primeros 10 tickets antes de fiarte de la proyección de presupuesto.
- OpenHands no es esfuerzo cero. Los 6 USD/día asumen que Docker está arriba, el runtime configurado, la API key de Claude Sonnet 4.5 puesta, y los prompts afinados. Te pasarás un fin de semana en el setup.
- Devin todavía no es un agente de frontend. Los stacks de practicantes con más engagement (@ryancarson usa Devin para backend, Codex para frontend, Claude Design para superficies de diseño) lo tratan como agente de backend / cloud. No le pidas que pinte UI pixel-perfect.
Cierre
La valoración es la noticia. La historia real son los cuatro tickets de arriba — qué es mecánico, qué es juicio, qué es “prefiero esperar” y qué es “debería sentarme”. Para un equipo típico de 10 ingenieros, el híbrido gana en coste y en resultado. Devin puro es la jugada de la nota de prensa. Claude Code puro deja el dolor de las actualizaciones de dependencias y los refactors multi-fichero a cargo de los seniors. OpenHands es una opción real solo si puedes absorber el coste de setup.
Si quieres un recorrido guiado de cómo conectar Claude Code al flujo de trabajo diario de un equipo — Sessions, hooks, agents, los patrones que sobreviven a un codebase real — nuestro curso de Claude Code Mastery es la versión estructurada del lado in-loop de este stack.
¿Qué tipo de ticket de los cuatro consumió más horas de ingeniero senior en tu equipo la semana pasada — y cuál es el stack más barato que de verdad lo resuelve?
Fuentes
- Cognition — More Devins in More Places (anuncio Serie D)
- Bloomberg — Cognition raises $1B at $26B value (27 de mayo)
- TechCrunch — AI coding startup Cognition raises $1B at $25B pre-money valuation
- The Decoder — Cognition more than doubles its valuation to $26 billion in under nine months
- Revista Cloud — Infosys y Cognition llevan Devin a la empresa global
- Yeswelab — Devin AI: El Primer Ingeniero de Software Autónomo con IA
- Artesano Digital — Devin 2.0: El agente de IA con precios accesibles
- Flownexion — Las mejores herramientas de IA para programadores en 2026
- WeavAI — Devin 2.0 Review: AI Engineer Price Drops to $20
- Documentación oficial de Claude Code