Claude Opus 4.8 : quel niveau d'effort choisir, et quand ?

Anthropic a sorti Claude Opus 4.8 le 28 mai 2026, et pendant que tout le monde fixe les graphiques de benchmarks, le lancement glisse un petit curseur qui change bien plus ton quotidien avec le modèle. Il s’appelle effort, et il est désormais posé directement dans la barre latérale de claude.ai, à côté du sélecteur de modèle — plus seulement caché dans un paramètre réservé aux devs.

Tous les articles citent les niveaux. Presque aucun ne te dit lequel choisir et quand. C’est exactement ce qu’on règle ici — en français, parce que les guides clairs là-dessus se comptent encore sur les doigts d’une main.

Claude Opus 4.8, sorti le 28 mai 2026 Source : Introducing Claude Opus 4.8 – Anthropic – consulté le 29 mai 2026.

Ce qu’est vraiment le curseur d’effort

Vois l’effort comme une molette « à quel point je dois réfléchir à ça ? ». En réglage haut, Claude réfléchit plus souvent et plus en profondeur avant de répondre : meilleurs résultats, mais plus lent et plus de tokens. En réglage bas, il répond plus vite et grignote ta limite d’usage plus doucement, au prix d’un peu de profondeur.

Un détail piège presque tout le monde au début : les noms changent selon l’endroit où tu es.

Dans claude.ai et Cowork, le curseur est à côté du sélecteur de modèle. Le défaut est high. Tu peux monter sur « Extra » ou « Max ».
Dans Claude Code et l’API, la même molette a cinq noms : low, medium, high, xhigh, max. Ce que claude.ai appelle « Extra », c’est exactement xhigh dans Claude Code.

La documentation effort d’Anthropic est claire : par défaut Claude utilise high, en dépensant autant de tokens que nécessaire. Tu peux monter à max pour la capacité maximale, ou descendre pour être plus économe.

Les cinq niveaux, et à quoi sert chacun

Low

Requêtes rapides, classification, gros volumes

Medium

Réponses solides, économie de tokens modérée

High — défaut

Raisonnement complexe, code difficile, le quotidien

Xhigh (Extra)

Agents, code long, recherche en profondeur

Max

Capacité maximale, aucune limite de tokens

le plus rapide & économe tokens · profondeur · vitesse le plus profond & coûteux

Low – Le plus économe. Pour la classification simple, les recherches rapides ou les tâches en gros volume où un résultat marginalement meilleur ne vaut pas la latence en plus.
Medium – L’option équilibrée : performance solide sans la dépense complète de high.
High (défaut) – Là où Opus 4.8 reste si tu ne touches à rien, sur toutes les surfaces (API et Claude Code compris). Fait pour le raisonnement complexe, l’analyse fine et le code difficile. Ce pour quoi tu ouvres Claude la plupart du temps.
Xhigh / Extra – Pour le code avancé et le travail agentique avec exploration poussée : appels d’outils répétés, recherches profondes, tâches qui tournent seules un moment.
Max – Le plafond. Aucun budget, aucun raccourci.

La recommandation officielle d’Anthropic, tirée directement des docs Opus 4.8 : « Commence avec xhigh pour le code et les tâches agentiques, utilise high pour le reste du travail exigeant, et ne descends sur medium ou low que lorsque tu as mesuré que le niveau inférieur tient la qualité. »

Traduit pour le quotidien : agent de code → xhigh ; réflexion normale → laisse sur high ; travail en masse ou trivial → descends sur medium/low seulement après avoir vérifié que ça passe encore. Astuce pratique des docs : en xhigh ou max, mets un max_tokens généreux (64k pour démarrer) pour laisser au modèle la place de réfléchir.

Ce que ça veut dire pour toi

Utilisateur lambda de claude.ai (rédaction, marketing, analyse) : Laisse sur High. Descends sur Medium seulement pour un truc répétitif où tu veux de la vitesse. « Extra » et « Max » sont pour les tâches longues et difficiles ; dans un chat normal, ils te font surtout attendre.

Utilisateur de Claude Code : /effort xhigh pour les vraies sessions de code, high pour les retouches rapides, max seulement pour les gros morceaux (ça consomme des tokens en conséquence).

Jobs API en gros volume : Démarre en medium ou low et lance tes évals. Anthropic est clair : ne descends qu’une fois que tu as mesuré que la qualité tient.

Limite d’usage serrée (plan Pro) : L’effort est maintenant ton modérateur. Plus bas = ta limite dure plus longtemps.

Ce que le curseur ne peut pas faire

Ce n’est pas une garantie de qualité. Max fait que Claude essaie plus fort, pas qu’il ait plus raison. Ce qu’il rate en High, il le rate en Max : tout aussi faux, mais plus cher.
Plus haut n’est pas gratuit. Xhigh et Max échangent vitesse et tokens contre profondeur, par conception. Parfait pour un refactoring costaud, du gâchis sur une mini-tâche.
Ça ne corrige pas un prompt flou. L’effort amplifie ta consigne, il ne la remplace pas. Pour ça, le bon prompting reste indispensable.
Ça ne change pas ce que le modèle sait. Même Opus 4.8, même contexte, même date de connaissances à chaque niveau. Tu règles seulement à quel point il travaille.

En résumé

Le curseur d’effort est la petite nouveauté la plus utile d’Opus 4.8 — justement parce que ce n’est pas un chiffre de benchmark, mais un bouton que tu vas vraiment tourner. Tout le guide tient sur un post-it : laisse sur High ; monte sur Xhigh/Extra pour les agents de code et les longs jobs ; descends sur Medium/Low pour le travail en masse ou trivial ; ne sors le Max qu’avec une vraie raison (et un œil sur l’addition).

Pour piloter Claude avec aisance, nos formations Maîtrise de Claude Code et IA Claude Opus & Sonnet construisent exactement ça — et l’autre moitié de l’équation qu’aucun curseur d’effort ne remplace : la consigne qui vaut la peine qu’on s’y attelle.

Claude Opus 4.8 : quel niveau d'effort choisir, et quand ?

Table des Matières

Ce qu’est vraiment le curseur d’effort

Les cinq niveaux, et à quoi sert chacun

Ce que ça veut dire pour toi

Ce que le curseur ne peut pas faire

En résumé

Sources

Développe de Vraies Compétences IA

Maîtriser Claude Code

Claude Opus, Sonnet, Haiku : choisir le bon modèle Anthropic

Les Fondamentaux de l'IA