Il y a deux mois, Anthropic a construit un modèle d’IA puis a décidé qu’il était trop dangereux pour être vendu. Capable de dénicher tout seul des failles de sécurité inconnues dans tous les grands systèmes d’exploitation et navigateurs, il a fini sous clé, réservé à environ 200 partenaires triés sur le volet.
Hier, ce modèle a débarqué dans l’appli Claude. Avec une cage autour.
Claude Fable 5 est le modèle d’IA le plus puissant jamais mis entre les mains du public, avec une avance qui a surpris même les blasés du benchmark. C’est aussi le lancement le plus étrange de l’année : il coûte le double de l’ancien fleuron, certaines questions sont discrètement traitées par un autre modèle, et si tu as un abonnement Claude, il n’est inclus que jusqu’au 22 juin. Tom’s Guide a résumé la situation en une phrase : disponible sans surcoût, mais pas pour longtemps. Voici le tableau complet — et surtout, quoi en faire cette semaine.
C’est quoi, Claude Fable 5, au juste ?
La version courte : Fable 5, c’est le modèle « Mythos » d’Anthropic avec un harnais de sécurité.
La version longue commence le 7 avril, quand Anthropic annonce un modèle de frontière baptisé Claude Mythos Preview… et refuse de le sortir. Pas pour faire monter la sauce : le modèle savait découvrir en autonomie des failles zero-day — des vulnérabilités que personne ne connaît encore — et les transformer en exploits fonctionnels. D’après Anthropic, il a trouvé des bugs critiques dans tous les grands OS et navigateurs, dont 99 % étaient inconnus jusque-là. L’AI Security Institute britannique a mené sa propre évaluation : Mythos réussissait 73 % de tâches cyber de niveau expert qu’aucun modèle ne savait même entamer un an plus tôt.
Du coup, au lieu d’un lancement public, Mythos est parti dans un programme verrouillé, Project Glasswing — Apple, Google, Microsoft, Nvidia, AWS, CrowdStrike et au final près de 200 organisations dans plus de 15 pays, qui s’en servent pour trouver et corriger leurs propres failles avant les attaquants. Anthropic a mis jusqu’à 100 millions de dollars de crédits d’usage sur la table pour financer les correctifs.
Fable 5, sorti le 9 juin, c’est la porte d’entrée pour nous autres. Dixit Anthropic : un modèle de classe Mythos « rendu sûr pour l’usage général ». Même cerveau, règles du jeu différentes.
Les chiffres, et pourquoi tout le monde a tiqué
Les benchmarks ne disent jamais tout, mais ce tableau de lancement n’était pas serré. Sur SWE-bench Pro — la version corsée et anti-triche du test standard « sait-il corriger de vrais bugs GitHub » — Fable 5 atteint 80,3 %, premier modèle à franchir les 80. L’ancien fleuron maison, Claude Opus 4.8, plafonne à 69,2 %. GPT-5.5 d’OpenAI affiche 58,6 %, Gemini 3.1 Pro de Google 54,2 %.

Le tableau de lancement d’Anthropic. Les lignes étoilées sont celles où les garde-fous de Fable 5 s’activent — ces scores reflètent le Mythos 5 sans bride. Source : Anthropic
Et le schéma se répète bien au-delà du code — la partie que la plupart des articles ont zappée :
| Benchmark (ce qu’il mesure) | Fable 5 / Mythos 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro (code réel) | 80,3 % | 69,2 % | 58,6 % | 54,2 % |
| GDPval-AA (travail de bureau, Elo) | 1932 | 1890 | 1769 | 1314 |
| Humanity’s Last Exam, sans outils | 59,0 %* | 49,8 % | 41,4 % | 44,4 % |
| Legal Agent Benchmark (travail juridique) | 13,3 % | 10,4 % | 2,1 % | 0,0 % |
| OSWorld-Verified (usage d’ordinateur) | 85,0 % | 83,4 % | 78,7 % | 76,2 % |
| Terminal-Bench 2.1 (travail agentique) | 88,0 % | 82,7 % | 83,4 % | 70,7 % |
* Les scores étoilés incluent une part de bascule vers Opus — voir la section sur la cage.
Deux lignes méritent une traduction. GDPval mesure de vrais livrables professionnels — les notes, analyses et rapports de 44 métiers. L’écart de 1932 contre 1769 pour GPT-5.5, c’est donc le benchmark « ton vrai boulot », pas un test de code. Et sur le Legal Agent Benchmark, tous les scores semblent ridiculement bas parce que l’épreuve est brutale — mais l’ordre compte : 13,3 % contre 2,1 %, c’est un facteur six sur le travail juridique agentique.
Les retours du terrain arrivent vite. Stripe affirme que le modèle a compressé en une journée une migration de 50 millions de lignes de code estimée à plus de deux mois de travail d’équipe. Et l’agrégateur indépendant Artificial Analysis place Fable 5 numéro 1 de son Intelligence Index à 64,9 — environ cinq points devant le meilleur modèle non-Anthropic. Sur un indice composite, cinq points, c’est énorme.
La cage : comment Anthropic a « sécurisé » Mythos
C’est la partie réellement inédite du lancement — et celle qu’il faut comprendre avec précision, parce que c’est là que vit la polémique. Le système de sécurité de Fable 5 a deux étages qui fonctionnent de manières complètement différentes.
L’étage un est visible. Des modèles classifieurs séparés surveillent chaque requête. Quand l’un d’eux détecte une question dans trois catégories — cybersécurité offensive, biologie et chimie, ou tentatives d’extraire les capacités du modèle pour entraîner un concurrent — Fable 5 ne répond pas. C’est Claude Opus 4.8 qui répond à sa place, et tu en es informé. Vois ça comme un spécialiste qui passe certaines questions à un collègue plutôt que de refuser tout net. Anthropic affirme que plus de 95 % des sessions ne le déclenchent jamais ; Artificial Analysis a mesuré environ 8 % pendant ses benchmarks, surtout sur les épreuves scientifiques. La logique tient dans un seul chiffre : sur les tests de développement d’exploits, le Mythos 5 sans bride score 78 % là où Opus 4.8 fait 40 %. Ces 38 points d’écart, c’est précisément l’avantage qu’Anthropic refuse d’offrir aux attaquants.
L’étage deux est invisible, et c’est lui qui fait débat chez les experts. Enfoui dans la system card : pour les requêtes portant sur la construction d’IA de frontière elle-même — pipelines de pré-entraînement, infrastructure d’entraînement distribué, conception d’accélérateurs — Fable 5 ne refuse pas et ne bascule pas. Il répond avec une efficacité délibérément bridée, via des vecteurs de pilotage et des prompts modifiés, sans te le dire. Anthropic estime que cela touche ~0,03 % du trafic, concentré sur moins de 0,1 % des organisations.
La critique, venue de gens par ailleurs fans, est tranchante. Nathan Lambert, de l’Allen Institute for AI — qui qualifie dans le même texte Fable 5 de « modèle le plus intelligent accessible au grand public » — écrit qu’« un modèle d’IA qui devient automatiquement moins intelligent sans me prévenir est une IA catégoriquement désalignée ». L’inquiétude de fond est épistémique : un refus se voit, une bascule s’évalue, mais une réponse silencieusement dégradée laisse le chercheur incapable de savoir si son idée a échoué, si son code a planté, ou si le modèle a fait semblant.
L’argument d’en face, honnêtement : c’est documenté — c’est même comme ça que tout le monde l’a appris —, la part de trafic concernée est minuscule, et la mesure vise exactement les acteurs les moins susceptibles de respecter des conditions d’utilisation. Pour l’écrasante majorité des métiers, ça ne change rien. Mais le précédent existe désormais, et c’est ça, la vraie info.
Dernier détail planqué dans le lancement : tout le trafic de classe Mythos est soumis à une rétention de données obligatoire de 30 jours — y compris pour les entreprises sous contrat zéro-rétention. Anthropic invoque la détection d’attaques inédites et de jailbreaks, pas l’entraînement. Si tu traites des données clients sensibles, vérifie avec ton juridique avant d’y router quoi que ce soit.
Le prix, et le piège du 22 juin
Fable 5 coûte 10 dollars par million de tokens en entrée et 50 dollars par million en sortie — exactement le double d’Opus 4.8, et moins de la moitié de ce que payait la Mythos Preview. La fenêtre de contexte (1 million de tokens, environ 750 000 mots de mémoire de travail) et la réponse maximale (128 000 tokens) ne bougent pas. L’intelligence a grimpé ; le contenant, non.
Pour les utilisateurs API et les boîtes en facturation à l’usage, fin de l’histoire : c’est dispo, tu paies à la consommation, terminé.
Pour les millions d’abonnés Claude Pro, Max et Team, le chrono tourne. Fable 5 est inclus dans les forfaits payants sans surcoût uniquement jusqu’au 22 juin — en brûlant ton quota d’usage deux fois plus vite qu’Opus —, puis passe dès le 23 juin sur des crédits d’usage séparés, jusqu’à revenir « en standard quand la capacité le permettra ». Sans date.
Cette fenêtre de deux semaines a déclenché un débat plus bruyant que les benchmarks. Une lecture virale déclare l’abonnement IA au forfait mort et enterré : l’économie des modèles de frontière ne survivrait plus au buffet à volonté, et les crédits d’usage seraient l’avenir que tout le monde va copier. La lecture plus posée : Anthropic a tarifé honnêtement du calcul de classe Mythos, s’est fait submerger par la demande du lancement, et rationne en attendant que les GPU suivent. Les deux peuvent être vraies. Le fait pratique, lui, ne bouge pas : la dégustation gratuite s’arrête le 22 juin.
Ce qu’il ne sait pas faire
- Être bon marché ou rapide. Le double du prix, c’est réel ; les premiers utilisateurs signalent de longs temps de réflexion, et des runs agentiques de 40+ minutes apparaissent sur les factures. Pour les questions du quotidien, c’est le mauvais outil — comme embaucher un ingénieur structure pour accrocher un cadre.
- Tout gagner partout. Andon Labs a fait tourner le Mythos 5 sans bride dans sa simulation d’entreprise Vending-Bench : il a gagné moins d’argent qu’Opus 4.7 et GPT-5.5. Une équipe, un benchmark — mais un bon antidote à l’euphorie du jour J.
- Te laisser tranquille si tu bosses en sécurité. Le classifieur cyber est réglé prudent, et des devs en plein travail purement défensif tombent déjà sur la bascule Opus.
- Garantir sa présence dans ton abonnement en juillet. « De retour quand la capacité le permettra », c’est une intention, pas une date.
Fable 5 ou Opus 4.8 : lequel utiliser, concrètement ?
Opus 4.8 n’a pas disparu, et à moitié prix il reste le choix par défaut raisonnable pour l’essentiel du travail. Le partage honnête :
| Ta tâche | Utilise |
|---|---|
| Rédaction courante, e-mails, résumés | Opus 4.8 — Fable est surdimensionné |
| Recherche ou analyse longue, multi-étapes | Fable 5 — l’écart se voit en profondeur |
| Code sérieux, débogage, migrations | Fable 5 — c’est là qu’il ridiculise le reste |
| Documents complexes : finance, juridique, PDF denses | Fable 5 — les scores GDPval et juridiques en témoignent |
| Recherche en sécurité, sujets bio/chimie | Opus 4.8 directement — Fable basculerait de toute façon |
| Tâches automatisées à gros volume et petit budget | Opus 4.8 ou Haiku — les tokens s’additionnent vite |
Ce que ça change pour toi
Si tu paies déjà Claude Pro, Max ou Team : tu as jusqu’au 22 juin pour découvrir — sans surcoût — si la différence compte pour ton travail. Ne gaspille pas la fenêtre en bavardage qu’il traite comme n’importe quel modèle. File-lui ta tâche réelle la plus dure : l’analyse du tableur ingérable, le contrat de 80 pages, le rapport que tu repousses. Si le résultat te scotche, tu sauras si les crédits valent le coup plus tard. Sinon, Opus 4.8 reste excellent et inclus.
Si tu es sur ChatGPT et que tu te poses la question : l’écart avec GPT-5.5 est la plus grosse avance qu’un labo ait tenue depuis deux ans — mais elle se concentre sur le travail profond, agentique, au long cours. Si ton usage de l’IA est conversationnel, tu ne la sentiras pas. Si tu pousses les modèles dans leurs retranchements sur de vrais livrables, c’est le rare moment où « essaie l’autre » repose sur des données plutôt que sur du feeling.
Si tu évalues des outils IA pour une boîte : deux points discrets pèsent plus lourd que les benchmarks. La rétention obligatoire de 30 jours écrase les accords zéro-rétention sur les modèles de classe Mythos — à valider avec la conformité avant d’y router du sensible. Et le passage de l’abonnement aux crédits est un signal tarifaire que toute l’industrie observe : budgète l’IA de frontière à l’usage, pas en sièges fixes éternels.
Si tu n’as jamais utilisé l’IA sérieusement : rien dans ce lancement ne change ton point de départ — les offres gratuites de Claude et ChatGPT restent la meilleure école. Mais note ce qui vient de se passer : l’IA la plus puissante jamais vendue est désormais surveillée par d’autres IA. Cette architecture — capacité plus gardiens — c’est à ça que ressembleront les prochaines années.
En deux mots
Claude Fable 5, ce sont deux histoires en une. La première : la puissance brute — le plus grand bond générationnel depuis des années, preuves à l’appui en code, travail intellectuel, finance et droit, avec deux semaines pour le tester gratuitement si tu es abonné. La seconde : le précédent — premier modèle de frontière dont le danger a été géré non pas en le retenant, mais en l’expédiant dans un maillage de classifieurs, de bascules, de règles de rétention et de limites silencieuses. La première histoire est la raison de l’essayer avant le 22 juin. La seconde, celle pour laquelle on se souviendra de ce lancement bien après que les benchmarks auront vieilli.
Si la question « quel modèle pour quel boulot » te bloque régulièrement, notre cours ChatGPT vs Claude la règle avec des comparaisons pratiques — et Fondamentaux de l’IA construit ce jugement depuis zéro. Les deux premières leçons de chaque cours sont gratuites.
Sources
- Claude Fable 5 and Claude Mythos 5 — Anthropic
- Claude Fable 5 (Mythos) est disponible sans surcoût, mais pas pour longtemps — Tom’s Guide
- Mythos 5 et Fable 5 : Anthropic dévoile son IA la plus puissante et double ses prix — Journal du Net
- Our evaluation of Claude Mythos Preview’s cyber capabilities — UK AI Security Institute
- Project Glasswing: Securing critical software for the AI era — Anthropic
- Claude Fable 5 and new safety fables — Interconnects (Nathan Lambert)
- Anthropic’s Claude Fable 5 is a version of Mythos the public can access today — TechCrunch