Devin vs Claude Code : que vaut le milliard de Cognition pour ton équipe

Le 27 mai 2026, Cognition AI a bouclé un tour de financement Series D de plus d’un milliard de dollars à une valorisation de 26 milliards — soit plus du double des 10,2 milliards atteints il y a neuf mois. Lux Capital et General Catalyst ont mené l’opération, avec 8VC en co-lead. Le chiffre qui a tourné sur X côté francophone hier soir, ce n’était pourtant pas la valorisation. C’était celui-ci : 89 % des pull requests internes de Cognition sont désormais ouvertes par Devin, leur propre IA.

Si tu pilotes une équipe de dix ingénieurs à Paris, Lyon, Montréal ou Bruxelles, tu as probablement reçu un message ce matin. Du CTO. Du directeur général. Du contrôleur de gestion qui se demande si la facture IA du prochain trimestre est déjà hors de contrôle.

Avant de répondre, voici ce qu’il faut savoir.

Ce qui a vraiment changé

Trois choses ont atterri ces six dernières semaines et redéfinissent la conversation :

Devin 2.0 (avril 2026) — Cognition a fait passer son entrée de gamme de 500 USD/mois à 20 USD/mois + 2,25 USD par Agent Compute Unit (ACU), une ACU correspondant à environ 15 minutes de travail actif. Un fix de bug typique consomme 2 à 3 ACU. Une migration multi-fichiers monte facilement à 30 et plus. Concrètement : 4,50 à 6,75 USD pour un fix routinier, 67,50 USD et plus pour un refactor sérieux.
Claude Code Remote Tasks — La dernière mise à jour d’Anthropic a poussé le score SWE-Bench Verified à 87,6 %, le meilleur chiffre publié à fin mai 2026. Les tarifs n’ont pas bougé : Pro à 20 USD/mois, Max 5x à 100 USD/mois, Max 20x à 200 USD/mois. En usage réel intensif, on atterrit autour de 100 à 200 USD/mois.
Le contre-argument OpenHands — Le post de @iam_elias1 du 23 mai sur X (84 likes, 29 reposts) a fixé le plancher budgétaire : OpenHands (ex-OpenDevin) combiné au mode extended thinking de Claude Sonnet 4.5 atteint 72 % sur SWE-Bench Verified pour environ 6 USD/jour d’API en usage intensif. Open source. Sandboxé sous Docker. Pas de vendor lock-in. La phrase exacte du thread : « Six dollars par jour en usage intensif. Contre 500 dollars par mois pour Devin. »

La valo, c’est le titre. L’économie, c’est l’histoire.

Les 4 types de ticket — et quel agent gagne sur chacun

La bonne façon d’y penser n’est pas par marque, mais par forme de ticket. La promesse de Devin, c’est l’autonomie : tu lui passes une issue GitHub, il disparaît plusieurs heures, il ouvre une PR. La promesse de Claude Code, c’est le pair programming en direct : tu es au terminal, lui fait le travail, tu signes ligne par ligne. La bonne réponse dépend du ticket : préfères-tu attendre, ou bosser à côté de l’agent ?

Ticket 1 — Test flaky qui foire au hasard

Le classique « ce test a échoué trois fois cette semaine, on ne sait pas pourquoi. »

Claude Code (en boucle) : tu ouvres le fichier qui plante. Tu expliques à Claude d’où vient l’instabilité. Il trace la race condition ou la dépendance temporelle devant toi. Coût : peut-être 50 centimes de ton abonnement Max 5x. Temps réel : 15 à 30 minutes.
Devin (autonome) : tu assignes l’issue à une session Devin. Tu pars boire un café. Devin instrumente le test, trouve la source du flake, ouvre une PR. Consommation ACU : 2 à 3. Coût : 4,50 à 6,75 USD. Temps réel : ~45 minutes, mais tu n’étais pas dans la pièce.

Vainqueur : Claude Code, sur le coût et sur l’apprentissage. Tu apprends d’où venait l’instabilité. La prochaine fois tu repères plus vite.

Ticket 2 — Mise à jour de dépendances sur 30 fichiers

Le « il faut bumper React/Next/Express en vN+1. » Mécanique. Beaucoup de fichiers. Pénible.

Claude Code : tu lances la commande d’upgrade. Tu rattrapes les breakages à la main. Claude Code édite par lot mais tu restes en babysitting. Coût : quelques dollars sur l’abonnement. Temps réel : 2 à 3 heures.
Devin : tu confies l’issue avec la cible d’upgrade. Il fait l’upgrade, corrige les breakages, lance la suite complète, ouvre une PR. Consommation ACU : 15 à 25. Coût : ~50 USD. Temps réel : 2 à 4 heures côté Devin. Toi, tu as fait autre chose.

Vainqueur : Devin, sans hésiter. C’est le cas d’école du « préfère attendre plutôt que bosser à côté ». 50 USD pour récupérer trois heures d’ingénieur senior, le calcul est bon.

Ticket 3 — Construire un nouvel endpoint avec 4 appelants

Le « il faut un POST /api/v2/foo et quatre services doivent l’appeler. »

Claude Code : sur celui-là, tu veux probablement bosser à côté de l’agent. Concevoir la forme de l’endpoint, la surface d’auth, la gestion d’erreurs, les quatre intégrations consommateurs — c’est de l’architecture, pas du mécanique. Claude Code est excellent ici parce qu’il co-conçoit avec toi. Coût : quelques dollars. Temps réel : 2 à 3 heures.
Devin : Devin va le concevoir. Le résultat va probablement fonctionner. Mais : respectera-t-il vos conventions de service ? Comme l’a écrit @morganlinton sur X : « Les deux ont tendance à croire qu’ils ont fini le plan, alors qu’il reste des parties non construites ou de vrais bugs à corriger. » Consommation ACU : 20 à 30. Coût : 50 à 70 USD.

Vainqueur : Claude Code, avec une nuance. Devin gagne si votre codebase est suffisamment uniforme pour que les conventions d’un agent externe tombent dans la tolérance. Pour la plupart des équipes de dix ingénieurs ce n’est pas encore le cas.

Ticket 4 — Refactor multi-fichiers (rename + changement de signature sur 80 sites d’appel)

Claude Code : douloureux. Soit tu babysittes le rename, soit tu passes par un outil déterministe de refactoring et tu laisses Claude nettoyer les cas limites. Coût : quelques dollars d’abonnement. Temps réel : une demi-journée.
Devin : tu confies. Consommation ACU : 30 à 50. Coût : 70 à 115 USD. Temps réel : demi-journée côté Devin. Toi, tu as encore fait autre chose.

Vainqueur : Devin, si votre couverture de tests est honnête. Le risque : des régressions silencieuses sur les sites d’appel dont les tests ne couvrent pas le nouveau comportement — et ce risque existe avec n’importe quel outil, sauf qu’ici tu ne vois pas l’agent passer à côté. Couple Devin avec une CI stricte.

Le tableau honnête des coûts pour une équipe de dix ingénieurs

Une semaine type — 4 tests flaky, 2 mises à jour de dépendances, 3 nouveaux endpoints, 1 refactor important :

Stratégie	Dépense Devin	Dépense Claude Code	Total mensuel	Note
Tout Devin	~200 USD/sem sur tickets + 20 USD base = ~820 USD/dev/mois × 10 = 8 200 USD	—	~8 200 USD	L’option communiqué de presse
Tout Claude Code	—	200 USD/mois × 10 = 2 000 USD	2 000 USD	Abonnement, pas de dépassement par ticket
Hybride (Devin pour #2 + #4 ; Claude Code pour #1 + #3)	~300 USD/mois par dev × 10 = 3 000 USD	200 USD/mois × 10 = 2 000 USD	5 000 USD	Le stack réel qu’utilise @ryancarson — Devin pour agents backend/cloud, Claude Code ou Codex pour frontend/local
OpenHands + Claude Sonnet 4.5 API	—	~6 USD/jour × 22 jours ouvrés × 10 devs = 1 320 USD	1 320 USD	Le plancher budgétaire d’@iam_elias1

Les chiffres sont illustratifs, le calcul est réel. Le stack hybride se cale à 5 000 USD/mois pour l’équipe — contre 8 200 si tu pars tout-Devin, contre 1 320 si tu pars tout-open-source. Au cours actuel, 5 000 USD font environ 4 600 EUR : un tiers de salaire junior par mois pour l’infrastructure IA d’une équipe de dix. La vraie question pour chaque manager après la levée : « sur quels tickets les 3 200 USD/mois supplémentaires de Devin m’achètent vraiment trois heures d’ingénieur senior ? » La réponse est presque toujours #2 et #4. Presque.

Ce que ça veut dire pour toi

Si tu pilotes une équipe de 5 à 15 ingénieurs : hybride. Devin pour les tickets en forme de #2 et #4 (mécaniques, multi-fichiers, « préfère attendre plutôt que bosser à côté »). Claude Code en Max 5x ou Max 20x pour #1 et #3 (jugement, architecture, « il faut bosser à côté »). Budget : 4 à 5 K USD/mois pour l’équipe.
Si tu pilotes une équipe de 50+ ingénieurs : la mécanique interne de Devin s’améliore à l’échelle parce que les tickets autonomes dominent. Discute avec Cognition d’un tarif enterprise — les 20 USD de plancher étaient le tarif d’appel grand public ; les clients sérieux négocient.
Si tu es dev en solo ou équipe de 2 à 3 : Claude Code Pro ou Max 5x couvre 80 % de ce dont tu as besoin. Le pricing ACU de Devin est structuré pour les tickets de plusieurs heures — les devs solo en ont rarement.
Si ta boîte exige open source ou « pas de vendor lock-in » : OpenHands + API Sonnet 4.5. Le 72 % SWE-Bench est réel, le sandbox Docker est réel, et les ~6 USD/jour en usage intensif sont vraiment moins chers que n’importe quel abonnement. Le coût, tu le paies en week-ends de setup : rien n’est prêt à l’emploi.
Si tu es dans un secteur régulé (banque, assurance, santé, secteur public) : Devin a gagné les comptes Citi, Goldman Sachs et l’US Army parce que sa posture conformité est conçue pour ce profil d’acheteur. Claude Code en plan enterprise avec un contrat Anthropic entreprise t’amène à un endroit comparable. OpenHands non. Côté français, regarde aussi la question de la résidence des données et la conformité RGPD : les deux outils traitent l’inférence hors UE par défaut — discute des options EU-region avec ton équipe juridique avant production.

Ce que ça ne corrige pas

Les limites honnêtes, avant de changer ton stack :

Aucun agent ne supprime la revue de code. Que Devin ouvre 89 % des PR chez Cognition ne veut pas dire que l’entreprise relit les 11 % restants à la légère. Ça veut dire qu’un humain s’assoit toujours avec chacune. Chez toi aussi.
« J’ai testé Devin il y a un an, c’était nul » n’est plus valable. Comme l’a noté @nityasnotes (Exa) : « Si tu as essayé Devin à sa sortie, sache que c’est un produit complètement différent aujourd’hui. » La réputation de 2024 ne colle pas au produit de 2026. Refais le test avant de décider.
La consommation ACU est imprévisible tant que tu ne l’as pas observée deux semaines. Un « bug simple » peut tourner à 12 ACU parce que ta suite de tests est lente. Suis le coût par ticket sur tes dix premiers tickets avant de faire confiance à la projection.
OpenHands, ce n’est pas zéro effort. Le « 6 USD/jour » suppose que Docker tourne, le runtime configuré, la clé API Claude Sonnet 4.5 en place, et les prompts ajustés. Tu vas passer un week-end sur le setup.
Devin n’est pas encore un agent frontend. Les stacks de praticiens qui marchent (@ryancarson utilise Devin pour le backend, Codex pour le frontend, Claude Design pour les surfaces design) le traitent comme agent backend/cloud. Ne lui demande pas du pixel-perfect.

Bilan

La valorisation, c’est le titre. La vraie histoire, ce sont les quatre tickets ci-dessus — ce qui est mécanique, ce qui est jugement, ce qui est « je préfère attendre » et ce qui est « il faut bosser à côté ». Pour une équipe type de dix ingénieurs, l’hybride gagne sur le coût et sur le résultat. Devin pur, c’est l’option communiqué de presse. Claude Code pur laisse la douleur des mises à jour de dépendances et des refactors multi-fichiers sur les épaules des seniors. OpenHands est une vraie option seulement si tu peux absorber le coût de setup.

Si tu veux une visite guidée du câblage de Claude Code dans le quotidien d’une équipe — Sessions, hooks, agents, les patterns qui survivent à un vrai codebase — notre cours Claude Code Maîtrise est la version structurée du côté in-loop de ce stack.

Quel type de ticket parmi les quatre a mangé le plus d’heures d’ingénieur senior dans ton équipe la semaine dernière — et quel est le stack le moins cher qui le résout vraiment ?

Devin vs Claude Code : que vaut le milliard de Cognition pour ton équipe

Table des Matières

Ce qui a vraiment changé

Les 4 types de ticket — et quel agent gagne sur chacun

Ticket 1 — Test flaky qui foire au hasard

Ticket 2 — Mise à jour de dépendances sur 30 fichiers

Ticket 3 — Construire un nouvel endpoint avec 4 appelants

Ticket 4 — Refactor multi-fichiers (rename + changement de signature sur 80 sites d’appel)

Le tableau honnête des coûts pour une équipe de dix ingénieurs

Ce que ça veut dire pour toi

Ce que ça ne corrige pas

Bilan

Sources

Développe de Vraies Compétences IA

Maîtriser Claude Code

L'IA pour les Développeurs

Maîtriser le Prompt Engineering