Claude Code Ratenlimits verdoppelt: Die 10-Minuten-Q3-Rechnung

Claude Codes 5-Stunden-Limits sind ab 7. Mai verdoppelt, Peak-Hours weg. Die 10-Minuten-Rechnung für Engineering-Manager — plus 3 Gründe, das Plan-Upgrade noch nicht zu klicken.

Wenn dein Team in den letzten Monaten gesagt hat „wir evaluieren Claude Code neu, sobald Anthropic die Ratenlimits in Griff hat" — der Tag ist heute.

Gestern Nachmittag (6. Mai 2026) hat Anthropic einen Compute-Deal mit dem SpaceX-Datacenter Colossus 1 in Memphis verkündet — über 300 Megawatt Kapazität, mehr als 220.000 NVIDIA-GPUs innerhalb eines Monats. (Börse-Express) Drei Veränderungen treten ab heute in Kraft:

  1. Claude Codes 5-Stunden-Ratenlimits sind verdoppelt für Pro, Max, Team und sitz-basierte Enterprise-Pläne
  2. Die Peak-Hour-Reduktion entfällt für Pro und Max
  3. API Tier 1 Opus Throughput ist deutlich angehoben — die Berichterstattung nennt eine Erhöhung von ungefähr 1.500% bei Input-Tokens-pro-Minute und 900% bei Output-Tokens-pro-Minute

Der Free-Plan bleibt unverändert. Auch die Wochen-Caps sind unverändert.

Eine wichtige Einschränkung: Anthropic hat in der offiziellen Mitteilung zwar auf eine Tabelle verwiesen, aber keine konkreten Vorher-/Nachher-Token-pro-Minute-Werte als Maschinen-lesbaren Text veröffentlicht. Erste Reddit-r/ClaudeCode-Berichte vom 6. Mai sind gemischt — einige Nutzer sehen die saubere Verdopplung, mindestens ein Kommentator berichtete, sein effektives Kontingent „scheint gegenüber der Vorwoche halbiert worden zu sein" und verwies auf Drittanbieter-Tracker wie usage.report. Rechne mit einem 24-72-Stunden-Rollout-Bestätigungsfenster. (r/ClaudeCode 6. Mai Thread)

Wenn du Engineering-Managerin bist und Q3-Spend neu rechnest — oder Solo-Entwicklerin, die zwischen Pro und Max abwägt — hier ist die 10-Minuten-Rechnung für heute. Plus die drei „noch-nicht-upgraden"-Gates, die trotz Verdopplung weiter gelten.

Was sich konkret geändert hat — und was nicht

Drei Dinge, die heute landen, zwei, die Beobachtungs-Signale für dieses Quartal bleiben.

Was heute landet

5-Stunden-Cap auf bezahlten Plänen verdoppelt. Wenn dein Pro-Plan-Cap bisher X war, ist er jetzt ~2X. Pro, Max, Team, sitz-Enterprise — alle gleich. Anthropic publiziert die exakte Zahl nicht; das Cap ist algorithmisch und nutzungs-form-abhängig.

Peak-Hour-Reduktion weg für Pro und Max. Bis gestern bekam Pro/Max in den US-Hauptverkehrs-Stunden ein leise strengeres Cap. Das ist weg. Das Cap ist jetzt über den Tag uniform für Pro und Max.

API Tier 1 Opus Throughput-Sprung. Wenn du Opus über die API auf Tier 1 hittest, sind Input-Tokens-pro-Minute um etwa 1.500% gestiegen und Output-Tokens-pro-Minute um 900%. Das ist ein Step-Change für retrieval-lastige RAG-Workloads und für Eval-Suites — beides die wichtigsten Engpässe vieler kleiner Team-API-Kunden.

Was nicht

Wöchentliche Limits unverändert. Anthropic hat die Wochen-Cap explizit gehalten. Wenn dein eigentlicher Engpass das Wochen-Cap war (etwa 2 Stunden schwere Nutzung pro Tag über 5 Werktage), hilft die 5-Stunden-Verdopplung nicht.

Free-Plan unverändert. Wer auf Free gehofft hat, dass die Verdopplung mitgenommen wird — das ist nicht passiert.

Die 10-Minuten-Rechnung

Drei Zahlen, dann eine Entscheidung. Die Zeit, die ein Cappuccino braucht.

Schritt 1 — Wie sieht dein 5-Stunden-Cap-Schmerz aktuell aus?

Nimm die letzten 14 Werktage. Für jeden Tag eine Frage: hast du das 5-Stunden-Cap getroffen (die „Limit-erreicht"-Meldung gesehen) — und wenn ja, um welche Uhrzeit?

Drei Muster sind interessant:

  • „Ich treffe das Cap meistens vor dem Mittag" — vor 12:00 Uhr deutscher Zeit. Das ist das Muster, das die Verdopplung am stärksten heilt. Dein effektives Cap verdoppelt sich, was das Cap-Treffen wahrscheinlich auf den Nachmittag schiebt oder ganz eliminiert.
  • „Ich treffe das Cap an manchen Tagen am späten Nachmittag" — die Verdopplung hilft, aber prüfe das Wochen-Cap. Wenn das dein eigentlicher Engpass war, ändert die heutige Ankündigung nichts.
  • „Ich treffe das Cap selten oder nie" — die Verdopplung ist für deine Spend-Rechnung irrelevant. Du warst schon unter dem Cap. Plan nicht ändern. (Siehe Gate 3 unten.)

Schritt 2 — Wie sieht deine Peak-Hour-Exposition aus?

Wenn du auf Pro oder Max bist und dein Arbeits-Muster ist „die schweren Claude-Code-Sessions liegen während der US-Hauptzeit" — die Peak-Hour-Entfernung ist die zweite Sache, die hilft. Das Cap ist jetzt über den Tag uniform; der Hack „ich verschiebe meine Nachmittags-Arbeit auf 23 Uhr, um die Peak-Hour-Reduktion zu umgehen" ist nicht mehr nötig.

Auf Team oder Enterprise traf die Peak-Hour-Reduktion ohnehin nicht zu — diese Änderung berührt dich nicht.

Schritt 3 — Wie sieht dein Opus-API-Muster aus (falls vorhanden)?

Wenn du Opus direkt über die API auf Tier 1 hittest, ist der Throughput-Sprung die größte der drei Veränderungen. Drei Workloads, wo das ein echter Step-Change ist:

  • Long-Context Multi-Dokument-Retrieval (RAG-Stil): Input-Tokens-pro-Minute war der Engpass. Der 1.500%-Boost nimmt Long-Context-Workloads aus der Drosselung.
  • Eval-Suites mit Parallel-Runs: Das neue Cap erlaubt 5-10× Parallelisierung gegenüber vorher.
  • Agent- oder Tool-Use-Loops mit ausführlichem Trace-Output: Output-Tokens-pro-Minute war der sekundäre Engpass; der 900%-Boost nimmt auch das aus der Drosselung.

Zwei Workloads, wo es kein Step-Change ist:

  • Latenz-kritisches Hot-Path-Serving: dein Engpass war nicht das Per-Minute-Cap, sondern Per-Call-Latenz. Heute ändert sich das nicht.
  • Kleine-Kontext-Single-Turn-API-Calls: wenn du das Per-Minute-Cap nie getroffen hast, ändert das neue Cap nichts.

Die 3 „noch-nicht-upgraden"-Gates

Drei Muster, in denen die Verdopplung deine Rechnung nicht ändert — auch wenn die Schlagzeilen das Gegenteil suggerieren.

Gate 1 — Dein eigentlicher Engpass ist das Wochen-Cap

Das 5-Stunden-Cap ist die rollende Decke. Das Wochen-Cap ist die härtere. Anthropic hat das Wochen-Cap unverändert gehalten.

Wenn dein Team-Muster ist „wir treffen das Wochen-Cap am Mittwoch", erlaubt die 5-Stunden-Verdopplung dir am Montag und Dienstag schneller zu brennen — aber das Wochen-Cap am Mittwoch trifft dich trotzdem. Das Plan-Upgrade, das du wegen Wochen-Cap-Erleichterung in Erwägung gezogen hast, hat heute dieselbe Berechtigung wie gestern.

Gate 2 — Du routest schon mehr als 50% deiner Inferenz über Bedrock oder Vertex

Falls du bereits sinnvolle Workloads zu Anthropic-on-Bedrock oder Anthropic-on-Vertex migriert hast, ist die heutige Plan-Tier-Ratenlimit-Änderung für diese Workloads irrelevant. Bedrock und Vertex haben eigene Quota-Systeme, getrennt von den Plan-Caps.

Die Ausnahme: wenn deine Bedrock-Migration spezifisch durch den Ratenlimit-Schmerz auf Anthropic-direkt motiviert war, kann die heutige Ankündigung den Migrations-Kalkül umkehren. Re-evaluiere das Routing-Setup, bevor du den Migrations-Scope ausweitest.

Gate 3 — Du operierst schon unter dem alten Cap

Wenn dein 14-Tage-Muster zeigt, dass du das Cap nie getroffen hast, gibt dir die heutige Verdopplung doppelt so viel ungenutzten Headroom. An deinem Alltag und deiner Spend-Rechnung ändert sich nichts.

Der härteste Fall: ein Team mitten in einer Pro→Max-Upgrade-Diskussion, die mit „wir wollen Headroom zum Wachsen" begründet wurde. Das Headroom-Argument ist jetzt halb so teuer auf Pro zu erfüllen. Pause das Upgrade einen Monat, beobachte die tatsächliche Nutzung, dann entscheide.

Die 4 „heute-upgraden"-Muster

Vier Workloads, in denen die Verdopplung tatsächlich die Rechnung Richtung Plan-Upgrade oder anders-Routing verschiebt:

  1. Solo-Entwicklerin trifft das Pro-Cap meistens vor dem Mittag. Die Verdopplung lässt dich vermutlich länger auf Pro als geplant — aber wenn dein Muster zeigt, dass deine Arbeit natürlich wächst, gibt der Headroom dir jetzt ein Quartal mehr auf Pro statt Panik-Sprung zu Max.
  2. Team-Plan-Shop hat Non-Peak-Prod-Runs auf Nacht verlegt, um Peak-Hour-Reduktion zu umgehen. Die Peak-Hour-Entfernung kippt das. Hol diese Runs zurück in den Arbeitstag. Beobachte den Team-Throughput zwei Wochen, bevor du Sitze hinzufügst.
  3. Tier 1 Opus API-Nutzerin mit Hot-Path-latenz-kritischem Workload, der sekundär auf Per-Minute-Throughput beschränkt ist. Der 1.500%/900%-Throughput-Sprung ist der Unlock. Re-Benchmark deinen Hot-Path, bevor du auf Tier 2/3 springst.
  4. Enterprise-Sitz-Review für Mai oder Juni geplant. Die Per-Sitz-Rechnung mit dem neuen Cap neu durchziehen. Der Preis hat sich nicht geändert, aber was jeder Sitz liefert. Die meisten Renewal-Gespräche sollten für eine Re-Pricing-Runde pausieren, bevor unterschrieben wird.

Was das nicht löst

Vier ehrliche Grenzen, bevor du feierst.

  1. Das Wochen-Cap ist unverändert. Wenn dein eigentlicher Engpass das Wochen-Cap war, ändert heute nichts für dich.
  2. Der Free-Plan ist unverändert. Die Upgrade-Diskussion für Free-Nutzer ist heute gleich wie gestern.
  3. Der Tier-1-Opus-Boost gilt für Input/Output-Tokens-pro-Minute, nicht für Requests-pro-Minute. Dein API-Konkurrenz-Limit ist ein separates Cap.
  4. Die Cap-Verdopplung ist ‚ab heute’, aber Rollouts können 24-48h brauchen. Wenn du das neue Cap heute nicht in deiner Nutzung siehst, gib es übers Wochenende, bevor du ein Support-Ticket öffnest.

Die Quintessenz

Heute ist die größte einzelne Claude-Code-Ratenlimit-Änderung in der Produkt-Geschichte. Für Solo-Devs auf Pro, die mittags am Cap waren, eliminiert die Verdopplung wahrscheinlich die wachsende Panik in Richtung Max-Upgrade. Für Team- und Enterprise-Admins reduziert sie (ohne sie zu eliminieren) die Multi-Account-Split-Work-Hacks, die viele Teams als Workaround gefahren haben. Für Tier-1-Opus-API-Nutzer mit retrieval-lastigen Workloads ist der Throughput-Boost die Art von Veränderung, die das Re-Architekt der Eval-Suite oder RAG-Pipeline rechtfertigt.

Wenn du tiefer in das Tagesarbeit-Muster mit Claude Code einsteigen willst — Token-Sparen, Multi-Agent-Setups, die mit dem Cap spielen, Workflows, die den Ratenlimit-Schmerz strukturell vermeiden — deckt unser Kurs ChatGPT Meisterkurs den vollständigen Workflow ab.

Quellen

Echte KI-Skills aufbauen

Schritt-für-Schritt-Kurse mit Quizzes und Zertifikaten für den Lebenslauf