Claude Ultrathink : les modes de réflexion secrets que personne n'utilise

Découvre les modes de réflexion cachés de Claude — du 'think' à 'ultrathink'. Quand les utiliser, comment ils fonctionnent, et pourquoi ça ne marche que sur Claude Code.

Il existe une fonctionnalité dans Claude que la majorité des utilisateurs ignorent complètement.

C’est pas vraiment caché — Anthropic l’a documentée. Mais à moins de plonger sérieusement dans l’écosystème Claude Code, t’en as probablement jamais entendu parler.

Ça s’appelle « extended thinking ». Et à son niveau maximal, il y a un truc qui sonne presque mythique : ultrathink.

J’ai passé un bon moment à creuser pour comprendre ce que ces trucs font vraiment, quand c’est utile, et — surtout — quand ça ne sert à rien. Voilà ce que j’ai trouvé.

C’est quoi l’extended thinking ?

Quand tu poses une question à Claude, il répond généralement assez vite. Il lit ton prompt, génère une réponse, terminé.

Mais certains problèmes demandent plus… de réflexion.

L’extended thinking donne à Claude la permission de faire une pause avant de répondre. Au lieu de sauter directement à une réponse, il élabore le problème étape par étape, explore différentes approches, et considère les cas limites — tout ça avant que tu voies un seul mot.

Pense à ça comme ça : Claude normal, c’est ton collègue qui te balance une réponse rapide sur un coup de tête. Claude en extended thinking, c’est ce même collègue qui dit « Attends, laisse-moi réfléchir deux minutes » et qui le fait vraiment.

Pour les problèmes complexes — décisions d’architecture, bugs tordus, analyses multi-étapes — ce temps de réflexion supplémentaire produit souvent des résultats bien meilleurs.

La hiérarchie de pensée : du « think » à « ultrathink »

C’est là que ça devient intéressant.

Claude Code (l’outil en ligne de commande d’Anthropic) a des mots-clés intégrés qui déclenchent différents niveaux de réflexion. Chaque niveau alloue plus de « budget de pensée » — en gros, combien de temps Claude peut raisonner avant de répondre.

Mot-cléBudget de penséeIdéal pour
think~4 000 tokensDebug routinier, refactoring simple
think hard / megathink~10 000 tokensDesign d’API, planification de BDD, optimisation
think harder / ultrathink~32 000 tokensRedesign d’architecture, bugs critiques, migrations complexes

Les phrases déclencheurs sont flexibles. « Think about it », « think deeply », ou « think more » activent tous le niveau megathink. Pour la réflexion maximale, tu peux dire « think harder », « think really hard », « think very hard », ou simplement « ultrathink ».

Ce qui se passe quand tu déclenches ultrathink

Quand tu actives ultrathink, Claude obtient environ 32 000 tokens pour raisonner sur le problème avant de répondre.

C’est un sacré paquet d’espace de réflexion.

En pratique, ça signifie que Claude peut :

  • Envisager plusieurs approches de solution avant de s’engager
  • Dérouler une logique complexe étape par étape
  • Repérer les cas limites qu’il pourrait rater avec des réponses plus rapides
  • Planifier des changements multi-fichiers de façon cohérente
  • Déboguer des problèmes vicieux en traçant méticuleusement les possibilités

Pour un bug de production bien tordu ou une question du genre « je dois refactoriser tout ce système ? », ultrathink peut faire la différence entre une réponse utile et une réponse véritablement pertinente.

L’avertissement important : ça ne marche que sur Claude Code

Voilà ce qui m’a trompé au début, et je veux pas que tu tombes dans le même piège.

Les mots-clés ultrathink et extended thinking ne marchent que sur Claude Code — l’outil terminal/CLI.

Si tu tapes « ultrathink » dans l’interface web de Claude.ai, il se passe rien de spécial. C’est juste un autre mot dans ton prompt. Pareil pour l’API — à moins de configurer explicitement les paramètres de pensée dans ta requête API, les mots-clés ne déclenchent rien.

C’est important parce que j’ai vu des gens recommander « ajoute juste ultrathink à ton prompt » comme conseil général. Ce conseil ne s’applique que si tu utilises spécifiquement Claude Code.

Pour tous ceux qui utilisent le chat web ou l’API sans paramètres de pensée, concentrez-vous sur d’autres techniques de prompting. Les mots-clés ne vont pas vous aider.

Quand utiliser chaque niveau

Pas chaque tâche a besoin d’ultrathink. En vérité, l’utiliser trop souvent gaspille du temps et — si tu paies au token — de l’argent.

Voilà mon guide :

Utilise « think » (4K tokens) quand :

  • Tu répares un bug simple
  • Tu écris une fonction directe
  • Du refactoring de code routinier
  • Des questions rapides avec des réponses claires

Utilise « megathink » (10K tokens) quand :

  • Tu conçois une structure d’API
  • Tu planifies des schémas de base de données
  • L’optimisation de performance
  • La révision d’architecture de code
  • La résolution de problèmes multi-étapes

Utilise « ultrathink » (32K tokens) quand :

  • Tu redesignes l’architecture du système
  • Tu débogues des problèmes critiques en production
  • Des migrations complexes affectant plusieurs systèmes
  • Des problèmes où se tromper aurait des conséquences graves
  • Tu as essayé les approches normales et tu as besoin d’une analyse plus profonde

Le truc clé, c’est d’adapter le niveau de réflexion à la complexité du problème. Les problèmes simples ne deviennent pas meilleurs avec plus de réflexion — ça prend juste plus de temps.

La réalité du coût

L’extended thinking, c’est pas gratuit.

Sur la base du pricing actuel de Claude :

  • Réflexion basique (~4K tokens) : ~0,05 € par tâche
  • Réflexion améliorée (~10K tokens) : ~0,12 € par tâche
  • Ultrathink maximal (~32K tokens) : ~0,40 € par tâche

Pour les projets personnels, ces coûts sont généralement négligeables. Mais si tu exécutes Claude Code pour une équipe ou sur plein de tâches, l’utilisation systématique d’ultrathink s’accumule vite.

Utilise ultrathink pour les problèmes qui le méritent, pas par défaut.

Comment l’utiliser concrètement

Si tu utilises Claude Code et que tu veux essayer extended thinking :

Pour une complexité modérée :

Think hard about how to refactor this authentication module.
Consider security implications and backward compatibility.

Pour la réflexion maximale :

Ultrathink about this architecture. We're migrating from a
monolith to microservices. I need you to identify service
boundaries, data flow, and potential failure points.

Le mot-clé peut aller n’importe où dans ton prompt — début, fin, ou milieu. Le preprocessing de Claude Code le détectera et allouera le budget de pensée approprié.

Et Claude 4 avec Interleaved Thinking ?

Les derniers modèles Claude 4 ont introduit un truc appelé « interleaved thinking » — Claude peut maintenant réfléchir entre les appels d’outils, pas juste au début.

C’est particulièrement puissant pour les tâches agents où Claude fait plusieurs étapes : lire des fichiers, exécuter des commandes, faire des modifications. Au lieu de tout planifier à l’avance et d’espérer que ça passe, Claude peut raisonner sur les résultats au fur et à mesure et ajuster son approche.

Pour les tâches de coding complexes impliquant plusieurs opérations de fichiers, ça rend extended thinking encore plus précieux.

En résumé

L’extended thinking, c’est une vraie fonctionnalité utile — mais seulement dans le bon contexte.

Si tu utilises Claude Code pour du travail de dev complexe, apprendre à déclencher les niveaux de réflexion appropriés peut vraiment améliorer tes résultats. Commence avec « think » pour les tâches routinières, monte à « megathink » pour le travail de design, et garde « ultrathink » pour les problèmes vraiment durs qui le méritent.

Si tu utilises Claude par l’interface web ou l’API, ces mots-clés ne vont pas t’aider. Concentre-toi plutôt sur un prompting clair, un bon contexte, et des demandes structurées.

Et dans tous les cas, souviens-toi : plus de réflexion n’est pas toujours mieux. Adapte l’outil à la tâche.