Claude Ultrathink : les modes de réflexion secrets que personne n'utilise

Il existe une fonctionnalité dans Claude que la majorité des utilisateurs ignorent complètement.

C’est pas vraiment caché — Anthropic l’a documentée. Mais à moins de plonger sérieusement dans l’écosystème Claude Code, t’en as probablement jamais entendu parler.

Ça s’appelle « extended thinking ». Et à son niveau maximal, il y a un truc qui sonne presque mythique : ultrathink.

J’ai passé un bon moment à creuser pour comprendre ce que ces trucs font vraiment, quand c’est utile, et — surtout — quand ça ne sert à rien. Voilà ce que j’ai trouvé.

C’est quoi l’extended thinking ?

Quand tu poses une question à Claude, il répond généralement assez vite. Il lit ton prompt, génère une réponse, terminé.

Mais certains problèmes demandent plus… de réflexion.

L’extended thinking donne à Claude la permission de faire une pause avant de répondre. Au lieu de sauter directement à une réponse, il élabore le problème étape par étape, explore différentes approches, et considère les cas limites — tout ça avant que tu voies un seul mot.

Pense à ça comme ça : Claude normal, c’est ton collègue qui te balance une réponse rapide sur un coup de tête. Claude en extended thinking, c’est ce même collègue qui dit « Attends, laisse-moi réfléchir deux minutes » et qui le fait vraiment.

Pour les problèmes complexes — décisions d’architecture, bugs tordus, analyses multi-étapes — ce temps de réflexion supplémentaire produit souvent des résultats bien meilleurs.

La hiérarchie de pensée : du « think » à « ultrathink »

C’est là que ça devient intéressant.

Claude Code (l’outil en ligne de commande d’Anthropic) a des mots-clés intégrés qui déclenchent différents niveaux de réflexion. Chaque niveau alloue plus de « budget de pensée » — en gros, combien de temps Claude peut raisonner avant de répondre.

Mot-clé	Budget de pensée	Idéal pour
think	~4 000 tokens	Debug routinier, refactoring simple
think hard / megathink	~10 000 tokens	Design d’API, planification de BDD, optimisation
think harder / ultrathink	~32 000 tokens	Redesign d’architecture, bugs critiques, migrations complexes

Les phrases déclencheurs sont flexibles. « Think about it », « think deeply », ou « think more » activent tous le niveau megathink. Pour la réflexion maximale, tu peux dire « think harder », « think really hard », « think very hard », ou simplement « ultrathink ».

Ce qui se passe quand tu déclenches ultrathink

Quand tu actives ultrathink, Claude obtient environ 32 000 tokens pour raisonner sur le problème avant de répondre.

C’est un sacré paquet d’espace de réflexion.

En pratique, ça signifie que Claude peut :

Envisager plusieurs approches de solution avant de s’engager
Dérouler une logique complexe étape par étape
Repérer les cas limites qu’il pourrait rater avec des réponses plus rapides
Planifier des changements multi-fichiers de façon cohérente
Déboguer des problèmes vicieux en traçant méticuleusement les possibilités

Pour un bug de production bien tordu ou une question du genre « je dois refactoriser tout ce système ? », ultrathink peut faire la différence entre une réponse utile et une réponse véritablement pertinente.

L’avertissement important : ça ne marche que sur Claude Code

Voilà ce qui m’a trompé au début, et je veux pas que tu tombes dans le même piège.

Les mots-clés ultrathink et extended thinking ne marchent que sur Claude Code — l’outil terminal/CLI.

Si tu tapes « ultrathink » dans l’interface web de Claude.ai, il se passe rien de spécial. C’est juste un autre mot dans ton prompt. Pareil pour l’API — à moins de configurer explicitement les paramètres de pensée dans ta requête API, les mots-clés ne déclenchent rien.

C’est important parce que j’ai vu des gens recommander « ajoute juste ultrathink à ton prompt » comme conseil général. Ce conseil ne s’applique que si tu utilises spécifiquement Claude Code.

Pour tous ceux qui utilisent le chat web ou l’API sans paramètres de pensée, concentrez-vous sur d’autres techniques de prompting. Les mots-clés ne vont pas vous aider.

Quand utiliser chaque niveau

Pas chaque tâche a besoin d’ultrathink. En vérité, l’utiliser trop souvent gaspille du temps et — si tu paies au token — de l’argent.

Voilà mon guide :

Utilise « think » (4K tokens) quand :

Tu répares un bug simple
Tu écris une fonction directe
Du refactoring de code routinier
Des questions rapides avec des réponses claires

Utilise « megathink » (10K tokens) quand :

Tu conçois une structure d’API
Tu planifies des schémas de base de données
L’optimisation de performance
La révision d’architecture de code
La résolution de problèmes multi-étapes

Utilise « ultrathink » (32K tokens) quand :

Tu redesignes l’architecture du système
Tu débogues des problèmes critiques en production
Des migrations complexes affectant plusieurs systèmes
Des problèmes où se tromper aurait des conséquences graves
Tu as essayé les approches normales et tu as besoin d’une analyse plus profonde

Le truc clé, c’est d’adapter le niveau de réflexion à la complexité du problème. Les problèmes simples ne deviennent pas meilleurs avec plus de réflexion — ça prend juste plus de temps.

La réalité du coût

L’extended thinking, c’est pas gratuit.

Sur la base du pricing actuel de Claude :

Réflexion basique (~4K tokens) : ~0,05 € par tâche
Réflexion améliorée (~10K tokens) : ~0,12 € par tâche
Ultrathink maximal (~32K tokens) : ~0,40 € par tâche

Pour les projets personnels, ces coûts sont généralement négligeables. Mais si tu exécutes Claude Code pour une équipe ou sur plein de tâches, l’utilisation systématique d’ultrathink s’accumule vite.

Utilise ultrathink pour les problèmes qui le méritent, pas par défaut.

Comment l’utiliser concrètement

Si tu utilises Claude Code et que tu veux essayer extended thinking :

Pour une complexité modérée :

Think hard about how to refactor this authentication module.
Consider security implications and backward compatibility.

Pour la réflexion maximale :

Ultrathink about this architecture. We're migrating from a
monolith to microservices. I need you to identify service
boundaries, data flow, and potential failure points.

Le mot-clé peut aller n’importe où dans ton prompt — début, fin, ou milieu. Le preprocessing de Claude Code le détectera et allouera le budget de pensée approprié.

Et Claude 4 avec Interleaved Thinking ?

Les derniers modèles Claude 4 ont introduit un truc appelé « interleaved thinking » — Claude peut maintenant réfléchir entre les appels d’outils, pas juste au début.

C’est particulièrement puissant pour les tâches agents où Claude fait plusieurs étapes : lire des fichiers, exécuter des commandes, faire des modifications. Au lieu de tout planifier à l’avance et d’espérer que ça passe, Claude peut raisonner sur les résultats au fur et à mesure et ajuster son approche.

Pour les tâches de coding complexes impliquant plusieurs opérations de fichiers, ça rend extended thinking encore plus précieux.

En résumé

L’extended thinking, c’est une vraie fonctionnalité utile — mais seulement dans le bon contexte.

Si tu utilises Claude Code pour du travail de dev complexe, apprendre à déclencher les niveaux de réflexion appropriés peut vraiment améliorer tes résultats. Commence avec « think » pour les tâches routinières, monte à « megathink » pour le travail de design, et garde « ultrathink » pour les problèmes vraiment durs qui le méritent.

Si tu utilises Claude par l’interface web ou l’API, ces mots-clés ne vont pas t’aider. Concentre-toi plutôt sur un prompting clair, un bon contexte, et des demandes structurées.

Et dans tous les cas, souviens-toi : plus de réflexion n’est pas toujours mieux. Adapte l’outil à la tâche.