Claude Fable 5 : le guide complet avant la fin du gratuit le 22 juin

Claude Fable 5 décrypté : l'histoire Mythos, les vrais benchmarks face à GPT-5.5, la cage de sécurité à deux étages — et pourquoi le 22 juin est la date à retenir.

Il y a deux mois, Anthropic a construit un modèle d’IA puis a décidé qu’il était trop dangereux pour être vendu. Capable de dénicher tout seul des failles de sécurité inconnues dans tous les grands systèmes d’exploitation et navigateurs, il a fini sous clé, réservé à environ 200 partenaires triés sur le volet.

Hier, ce modèle a débarqué dans l’appli Claude. Avec une cage autour.

Claude Fable 5 est le modèle d’IA le plus puissant jamais mis entre les mains du public, avec une avance qui a surpris même les blasés du benchmark. C’est aussi le lancement le plus étrange de l’année : il coûte le double de l’ancien fleuron, certaines questions sont discrètement traitées par un autre modèle, et si tu as un abonnement Claude, il n’est inclus que jusqu’au 22 juin. Tom’s Guide a résumé la situation en une phrase : disponible sans surcoût, mais pas pour longtemps. Voici le tableau complet — et surtout, quoi en faire cette semaine.

C’est quoi, Claude Fable 5, au juste ?

La version courte : Fable 5, c’est le modèle « Mythos » d’Anthropic avec un harnais de sécurité.

La version longue commence le 7 avril, quand Anthropic annonce un modèle de frontière baptisé Claude Mythos Preview… et refuse de le sortir. Pas pour faire monter la sauce : le modèle savait découvrir en autonomie des failles zero-day — des vulnérabilités que personne ne connaît encore — et les transformer en exploits fonctionnels. D’après Anthropic, il a trouvé des bugs critiques dans tous les grands OS et navigateurs, dont 99 % étaient inconnus jusque-là. L’AI Security Institute britannique a mené sa propre évaluation : Mythos réussissait 73 % de tâches cyber de niveau expert qu’aucun modèle ne savait même entamer un an plus tôt.

Du coup, au lieu d’un lancement public, Mythos est parti dans un programme verrouillé, Project Glasswing — Apple, Google, Microsoft, Nvidia, AWS, CrowdStrike et au final près de 200 organisations dans plus de 15 pays, qui s’en servent pour trouver et corriger leurs propres failles avant les attaquants. Anthropic a mis jusqu’à 100 millions de dollars de crédits d’usage sur la table pour financer les correctifs.

Fable 5, sorti le 9 juin, c’est la porte d’entrée pour nous autres. Dixit Anthropic : un modèle de classe Mythos « rendu sûr pour l’usage général ». Même cerveau, règles du jeu différentes.

Les chiffres, et pourquoi tout le monde a tiqué

Les benchmarks ne disent jamais tout, mais ce tableau de lancement n’était pas serré. Sur SWE-bench Pro — la version corsée et anti-triche du test standard « sait-il corriger de vrais bugs GitHub » — Fable 5 atteint 80,3 %, premier modèle à franchir les 80. L’ancien fleuron maison, Claude Opus 4.8, plafonne à 69,2 %. GPT-5.5 d’OpenAI affiche 58,6 %, Gemini 3.1 Pro de Google 54,2 %.

Tableau officiel des benchmarks Anthropic pour Claude Mythos 5 et Fable 5 : SWE-Bench Pro à 80,3 % contre 69,2 % pour Opus 4.8 et 58,6 % pour GPT-5.5, avec des avances en travail intellectuel, usage d’ordinateur, droit et biologie
Benchmarks de lancement de Claude Fable 5

Le tableau de lancement d’Anthropic. Les lignes étoilées sont celles où les garde-fous de Fable 5 s’activent — ces scores reflètent le Mythos 5 sans bride. Source : Anthropic

Et le schéma se répète bien au-delà du code — la partie que la plupart des articles ont zappée :

Benchmark (ce qu’il mesure)Fable 5 / Mythos 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro (code réel)80,3 %69,2 %58,6 %54,2 %
GDPval-AA (travail de bureau, Elo)1932189017691314
Humanity’s Last Exam, sans outils59,0 %*49,8 %41,4 %44,4 %
Legal Agent Benchmark (travail juridique)13,3 %10,4 %2,1 %0,0 %
OSWorld-Verified (usage d’ordinateur)85,0 %83,4 %78,7 %76,2 %
Terminal-Bench 2.1 (travail agentique)88,0 %82,7 %83,4 %70,7 %

* Les scores étoilés incluent une part de bascule vers Opus — voir la section sur la cage.

Deux lignes méritent une traduction. GDPval mesure de vrais livrables professionnels — les notes, analyses et rapports de 44 métiers. L’écart de 1932 contre 1769 pour GPT-5.5, c’est donc le benchmark « ton vrai boulot », pas un test de code. Et sur le Legal Agent Benchmark, tous les scores semblent ridiculement bas parce que l’épreuve est brutale — mais l’ordre compte : 13,3 % contre 2,1 %, c’est un facteur six sur le travail juridique agentique.

Les retours du terrain arrivent vite. Stripe affirme que le modèle a compressé en une journée une migration de 50 millions de lignes de code estimée à plus de deux mois de travail d’équipe. Et l’agrégateur indépendant Artificial Analysis place Fable 5 numéro 1 de son Intelligence Index à 64,9 — environ cinq points devant le meilleur modèle non-Anthropic. Sur un indice composite, cinq points, c’est énorme.

La cage : comment Anthropic a « sécurisé » Mythos

C’est la partie réellement inédite du lancement — et celle qu’il faut comprendre avec précision, parce que c’est là que vit la polémique. Le système de sécurité de Fable 5 a deux étages qui fonctionnent de manières complètement différentes.

L’étage un est visible. Des modèles classifieurs séparés surveillent chaque requête. Quand l’un d’eux détecte une question dans trois catégories — cybersécurité offensive, biologie et chimie, ou tentatives d’extraire les capacités du modèle pour entraîner un concurrent — Fable 5 ne répond pas. C’est Claude Opus 4.8 qui répond à sa place, et tu en es informé. Vois ça comme un spécialiste qui passe certaines questions à un collègue plutôt que de refuser tout net. Anthropic affirme que plus de 95 % des sessions ne le déclenchent jamais ; Artificial Analysis a mesuré environ 8 % pendant ses benchmarks, surtout sur les épreuves scientifiques. La logique tient dans un seul chiffre : sur les tests de développement d’exploits, le Mythos 5 sans bride score 78 % là où Opus 4.8 fait 40 %. Ces 38 points d’écart, c’est précisément l’avantage qu’Anthropic refuse d’offrir aux attaquants.

Une requête, deux chemins de sécurité très différents
cyber / bio / distillation
Relais visible
Opus 4.8 répond à la place
bascule transparente — la réponse reste solide
développement d'IA de frontière
Limites silencieuses
vecteurs de pilotage · prompts modifiés
réponse dégradée — la partie qui fâche
Les deux mécanismes de sécurité de Fable 5. Le relais est affiché dans le produit ; les limites silencieuses ne figurent que dans la system card.

L’étage deux est invisible, et c’est lui qui fait débat chez les experts. Enfoui dans la system card : pour les requêtes portant sur la construction d’IA de frontière elle-même — pipelines de pré-entraînement, infrastructure d’entraînement distribué, conception d’accélérateurs — Fable 5 ne refuse pas et ne bascule pas. Il répond avec une efficacité délibérément bridée, via des vecteurs de pilotage et des prompts modifiés, sans te le dire. Anthropic estime que cela touche ~0,03 % du trafic, concentré sur moins de 0,1 % des organisations.

La critique, venue de gens par ailleurs fans, est tranchante. Nathan Lambert, de l’Allen Institute for AI — qui qualifie dans le même texte Fable 5 de « modèle le plus intelligent accessible au grand public » — écrit qu’« un modèle d’IA qui devient automatiquement moins intelligent sans me prévenir est une IA catégoriquement désalignée ». L’inquiétude de fond est épistémique : un refus se voit, une bascule s’évalue, mais une réponse silencieusement dégradée laisse le chercheur incapable de savoir si son idée a échoué, si son code a planté, ou si le modèle a fait semblant.

L’argument d’en face, honnêtement : c’est documenté — c’est même comme ça que tout le monde l’a appris —, la part de trafic concernée est minuscule, et la mesure vise exactement les acteurs les moins susceptibles de respecter des conditions d’utilisation. Pour l’écrasante majorité des métiers, ça ne change rien. Mais le précédent existe désormais, et c’est ça, la vraie info.

Dernier détail planqué dans le lancement : tout le trafic de classe Mythos est soumis à une rétention de données obligatoire de 30 jours — y compris pour les entreprises sous contrat zéro-rétention. Anthropic invoque la détection d’attaques inédites et de jailbreaks, pas l’entraînement. Si tu traites des données clients sensibles, vérifie avec ton juridique avant d’y router quoi que ce soit.

Le prix, et le piège du 22 juin

Fable 5 coûte 10 dollars par million de tokens en entrée et 50 dollars par million en sortie — exactement le double d’Opus 4.8, et moins de la moitié de ce que payait la Mythos Preview. La fenêtre de contexte (1 million de tokens, environ 750 000 mots de mémoire de travail) et la réponse maximale (128 000 tokens) ne bougent pas. L’intelligence a grimpé ; le contenant, non.

Pour les utilisateurs API et les boîtes en facturation à l’usage, fin de l’histoire : c’est dispo, tu paies à la consommation, terminé.

Pour les millions d’abonnés Claude Pro, Max et Team, le chrono tourne. Fable 5 est inclus dans les forfaits payants sans surcoût uniquement jusqu’au 22 juin — en brûlant ton quota d’usage deux fois plus vite qu’Opus —, puis passe dès le 23 juin sur des crédits d’usage séparés, jusqu’à revenir « en standard quand la capacité le permettra ». Sans date.

Cette fenêtre de deux semaines a déclenché un débat plus bruyant que les benchmarks. Une lecture virale déclare l’abonnement IA au forfait mort et enterré : l’économie des modèles de frontière ne survivrait plus au buffet à volonté, et les crédits d’usage seraient l’avenir que tout le monde va copier. La lecture plus posée : Anthropic a tarifé honnêtement du calcul de classe Mythos, s’est fait submerger par la demande du lancement, et rationne en attendant que les GPU suivent. Les deux peuvent être vraies. Le fait pratique, lui, ne bouge pas : la dégustation gratuite s’arrête le 22 juin.

Ce qu’il ne sait pas faire

  • Être bon marché ou rapide. Le double du prix, c’est réel ; les premiers utilisateurs signalent de longs temps de réflexion, et des runs agentiques de 40+ minutes apparaissent sur les factures. Pour les questions du quotidien, c’est le mauvais outil — comme embaucher un ingénieur structure pour accrocher un cadre.
  • Tout gagner partout. Andon Labs a fait tourner le Mythos 5 sans bride dans sa simulation d’entreprise Vending-Bench : il a gagné moins d’argent qu’Opus 4.7 et GPT-5.5. Une équipe, un benchmark — mais un bon antidote à l’euphorie du jour J.
  • Te laisser tranquille si tu bosses en sécurité. Le classifieur cyber est réglé prudent, et des devs en plein travail purement défensif tombent déjà sur la bascule Opus.
  • Garantir sa présence dans ton abonnement en juillet. « De retour quand la capacité le permettra », c’est une intention, pas une date.

Fable 5 ou Opus 4.8 : lequel utiliser, concrètement ?

Opus 4.8 n’a pas disparu, et à moitié prix il reste le choix par défaut raisonnable pour l’essentiel du travail. Le partage honnête :

Ta tâcheUtilise
Rédaction courante, e-mails, résumésOpus 4.8 — Fable est surdimensionné
Recherche ou analyse longue, multi-étapesFable 5 — l’écart se voit en profondeur
Code sérieux, débogage, migrationsFable 5 — c’est là qu’il ridiculise le reste
Documents complexes : finance, juridique, PDF densesFable 5 — les scores GDPval et juridiques en témoignent
Recherche en sécurité, sujets bio/chimieOpus 4.8 directement — Fable basculerait de toute façon
Tâches automatisées à gros volume et petit budgetOpus 4.8 ou Haiku — les tokens s’additionnent vite

Ce que ça change pour toi

Si tu paies déjà Claude Pro, Max ou Team : tu as jusqu’au 22 juin pour découvrir — sans surcoût — si la différence compte pour ton travail. Ne gaspille pas la fenêtre en bavardage qu’il traite comme n’importe quel modèle. File-lui ta tâche réelle la plus dure : l’analyse du tableur ingérable, le contrat de 80 pages, le rapport que tu repousses. Si le résultat te scotche, tu sauras si les crédits valent le coup plus tard. Sinon, Opus 4.8 reste excellent et inclus.

Si tu es sur ChatGPT et que tu te poses la question : l’écart avec GPT-5.5 est la plus grosse avance qu’un labo ait tenue depuis deux ans — mais elle se concentre sur le travail profond, agentique, au long cours. Si ton usage de l’IA est conversationnel, tu ne la sentiras pas. Si tu pousses les modèles dans leurs retranchements sur de vrais livrables, c’est le rare moment où « essaie l’autre » repose sur des données plutôt que sur du feeling.

Si tu évalues des outils IA pour une boîte : deux points discrets pèsent plus lourd que les benchmarks. La rétention obligatoire de 30 jours écrase les accords zéro-rétention sur les modèles de classe Mythos — à valider avec la conformité avant d’y router du sensible. Et le passage de l’abonnement aux crédits est un signal tarifaire que toute l’industrie observe : budgète l’IA de frontière à l’usage, pas en sièges fixes éternels.

Si tu n’as jamais utilisé l’IA sérieusement : rien dans ce lancement ne change ton point de départ — les offres gratuites de Claude et ChatGPT restent la meilleure école. Mais note ce qui vient de se passer : l’IA la plus puissante jamais vendue est désormais surveillée par d’autres IA. Cette architecture — capacité plus gardiens — c’est à ça que ressembleront les prochaines années.

En deux mots

Claude Fable 5, ce sont deux histoires en une. La première : la puissance brute — le plus grand bond générationnel depuis des années, preuves à l’appui en code, travail intellectuel, finance et droit, avec deux semaines pour le tester gratuitement si tu es abonné. La seconde : le précédent — premier modèle de frontière dont le danger a été géré non pas en le retenant, mais en l’expédiant dans un maillage de classifieurs, de bascules, de règles de rétention et de limites silencieuses. La première histoire est la raison de l’essayer avant le 22 juin. La seconde, celle pour laquelle on se souviendra de ce lancement bien après que les benchmarks auront vieilli.

Si la question « quel modèle pour quel boulot » te bloque régulièrement, notre cours ChatGPT vs Claude la règle avec des comparaisons pratiques — et Fondamentaux de l’IA construit ce jugement depuis zéro. Les deux premières leçons de chaque cours sont gratuites.

Sources

Développe de Vraies Compétences IA

Cours pas à pas avec quiz et certificats pour ton CV