Claude Opus 4.8: Welche Effort-Stufe wann? (Praxis-Guide)

Anthropic hat am 28. Mai 2026 Claude Opus 4.8 veröffentlicht – und während alle auf die Benchmark-Charts starren, steckt im Launch ein kleiner Regler, der deinen Alltag mit dem Modell viel stärker verändert. Er heißt Effort und sitzt jetzt direkt in der claude.ai-Seitenleiste neben der Modellauswahl, nicht mehr nur als API-Parameter für Entwickler.

Die Launch-Artikel nennen alle die Stufen. Kaum einer sagt dir, welche du wann nehmen sollst. Genau das holen wir hier nach – auf Deutsch, weil verständliche deutschsprachige Anleitungen dazu gerade noch dünn gesät sind.

Claude Opus 4.8, veröffentlicht am 28. Mai 2026 Quelle: Introducing Claude Opus 4.8 – Anthropic – abgerufen am 29. Mai 2026.

Was die Effort-Steuerung eigentlich ist

Stell dir Effort als „Wie gründlich soll ich darüber nachdenken?"-Regler vor. Bei höheren Stufen denkt Claude öfter und tiefer nach, bevor es antwortet – bessere Ergebnisse, dafür langsamer und mit mehr Tokens. Bei niedrigeren Stufen antwortet es schneller und frisst dein Rate-Limit langsamer auf, kostet dich aber etwas Tiefe.

Eine Sache verwirrt am Anfang fast alle: die Namen unterscheiden sich je nach Oberfläche.

In claude.ai und Cowork sitzt der Regler neben der Modellauswahl. Standard ist high. Du kannst auf „Extra" oder „Max" hochdrehen.
In Claude Code und der API hat derselbe Regler fünf Namen: low, medium, high, xhigh, max. Was claude.ai „Extra" nennt, ist exakt xhigh in Claude Code.

Anthropic formuliert es in der Effort-Dokumentation so: Standardmäßig nutzt Claude high effort und gibt so viele Tokens aus wie nötig. Du kannst auf max hochgehen für maximale Leistung oder runter, um sparsamer mit Tokens umzugehen.

Die fünf Stufen – und wofür du sie nimmst

Low

Schnelle Abfragen, Klassifizierung, Massenaufgaben

Medium

Solide Antworten, moderate Token-Ersparnis

High — Standard

Komplexes Denken, schwieriger Code, der Alltag

Xhigh (Extra)

Agenten, lange Coding-Tasks, tiefe Suche

Max

Maximale Leistung, keine Token-Grenze

am schnellsten & günstigsten Token-Verbrauch · Tiefe · Tempo am tiefsten & teuersten

Low – Am sparsamsten. Für einfache Klassifizierung, schnelle Nachschläge oder Massen-Tasks, bei denen ein minimal besseres Ergebnis die extra Latenz nicht wert ist.
Medium – Die ausgewogene Option: solide Leistung ohne den vollen Token-Verbrauch von high.
High (Standard) – Hier sitzt Opus 4.8, solange du nichts änderst – auf allen Oberflächen, inklusive API und Claude Code. Gemacht für komplexes Denken, anspruchsvolle Analysen und schwierigen Code. Das, wofür du Claude meistens öffnest.
Xhigh / Extra – Für fortgeschrittenes Coding und Agenten-Arbeit mit viel Exploration: wiederholte Tool-Aufrufe, tiefe Suchen, Aufgaben, die eine Weile selbstständig laufen.
Max – Die Decke. Kein Budget, keine Abkürzungen.

Anthropics offizielle Empfehlung, direkt aus den Opus-4.8-Docs: „Starte mit xhigh für Coding und agentische Aufgaben, nutze high für die meiste andere anspruchsvolle Arbeit, und gehe nur dann auf medium oder low runter, wenn du gemessen hast, dass die niedrigere Stufe deine Qualität hält."

Übersetzt für den Alltag: Coding-Agent → xhigh. Normales Denken → einfach auf high lassen. Massen- oder Trivial-Arbeit → erst auf medium/low runter, wenn du geprüft hast, dass es trotzdem passt. Praktischer Tipp aus den Docs: Bei xhigh oder max ein großzügiges max_tokens setzen (64k als Startwert), damit das Modell Platz zum Denken hat.

Was das für dich bedeutet

Normale claude.ai-Nutzer (Texter, Marketing, Analyse): Lass es auf High. Runter auf Medium nur, wenn du etwas Wiederholtes machst und Tempo willst. „Extra" und „Max" sind für lange, harte Aufgaben – im normalen Chat lassen sie dich vor allem warten.

Claude-Code-Nutzer: /effort xhigh für echte Coding-Sessions, high für schnelle Edits, max nur für die richtig harten Brocken (es verbraucht entsprechend Tokens).

Hochvolumige API-Jobs: Bei medium oder low starten und deine Evals laufen lassen. Anthropic sagt klar: erst runtergehen, wenn du gemessen hast, dass die Qualität hält.

Knappes Rate-Limit (Pro-Plan): Effort ist jetzt deine Drossel. Niedriger = dein Limit hält länger.

Was der Regler nicht kann

Keine Qualitätsgarantie. Max lässt Claude mehr versuchen, nicht richtiger sein. Was es bei High falsch macht, macht es bei Max nur teurer falsch.
Höher ist nicht gratis. Xhigh und Max tauschen Tempo und Tokens gegen Tiefe – per Design. Super für ein hartes Refactoring, Verschwendung bei einer Mini-Aufgabe.
Ein vager Prompt wird nicht besser. Effort verstärkt deine Anweisung, ersetzt sie nicht. Dafür ist nach wie vor sauberes Prompting zuständig.
Es ändert nichts am Wissen. Gleiches Opus 4.8, gleicher Kontext, gleicher Trainingsstand auf jeder Stufe. Du regelst nur, wie gründlich es arbeitet.

Fazit

Der Effort-Regler ist die nützlichste kleine Neuerung in Opus 4.8 – gerade weil es keine Benchmark-Zahl ist, sondern ein Knopf, den du wirklich drehst. Der ganze Guide passt auf einen Zettel: auf High lassen; für Coding-Agenten und lange Jobs auf Xhigh/Extra; für Massen- oder Trivial-Arbeit runter auf Medium/Low; Max nur mit gutem Grund (und Blick auf die Rechnung).

Wenn du Claude wirklich souverän nutzen willst, bauen unsere Kurse KI-Grundlagen und Prompt Engineering genau das auf – die andere Hälfte der Gleichung, die kein Effort-Regler ersetzt: die Anweisung, die den Aufwand überhaupt wert ist.

Claude Opus 4.8: Welche Effort-Stufe wann? (Praxis-Guide)

Inhaltsverzeichnis

Was die Effort-Steuerung eigentlich ist

Die fünf Stufen – und wofür du sie nimmst

Was das für dich bedeutet

Was der Regler nicht kann

Fazit

Quellen

Echte KI-Skills aufbauen

KI-Grundlagen

Prompt Engineering