Wenn dein Team in den letzten Monaten gesagt hat „wir evaluieren Claude Code neu, sobald Anthropic die Ratenlimits in Griff hat" — der Tag ist heute.
Gestern Nachmittag (6. Mai 2026) hat Anthropic einen Compute-Deal mit dem SpaceX-Datacenter Colossus 1 in Memphis verkündet — über 300 Megawatt Kapazität, mehr als 220.000 NVIDIA-GPUs innerhalb eines Monats. (Börse-Express) Drei Veränderungen treten ab heute in Kraft:
- Claude Codes 5-Stunden-Ratenlimits sind verdoppelt für Pro, Max, Team und sitz-basierte Enterprise-Pläne
- Die Peak-Hour-Reduktion entfällt für Pro und Max
- API Tier 1 Opus Throughput ist deutlich angehoben — die Berichterstattung nennt eine Erhöhung von ungefähr 1.500% bei Input-Tokens-pro-Minute und 900% bei Output-Tokens-pro-Minute
Der Free-Plan bleibt unverändert. Auch die Wochen-Caps sind unverändert.
Eine wichtige Einschränkung: Anthropic hat in der offiziellen Mitteilung zwar auf eine Tabelle verwiesen, aber keine konkreten Vorher-/Nachher-Token-pro-Minute-Werte als Maschinen-lesbaren Text veröffentlicht. Erste Reddit-r/ClaudeCode-Berichte vom 6. Mai sind gemischt — einige Nutzer sehen die saubere Verdopplung, mindestens ein Kommentator berichtete, sein effektives Kontingent „scheint gegenüber der Vorwoche halbiert worden zu sein" und verwies auf Drittanbieter-Tracker wie usage.report. Rechne mit einem 24-72-Stunden-Rollout-Bestätigungsfenster. (r/ClaudeCode 6. Mai Thread)
Wenn du Engineering-Managerin bist und Q3-Spend neu rechnest — oder Solo-Entwicklerin, die zwischen Pro und Max abwägt — hier ist die 10-Minuten-Rechnung für heute. Plus die drei „noch-nicht-upgraden"-Gates, die trotz Verdopplung weiter gelten.
Was sich konkret geändert hat — und was nicht
Drei Dinge, die heute landen, zwei, die Beobachtungs-Signale für dieses Quartal bleiben.
Was heute landet
5-Stunden-Cap auf bezahlten Plänen verdoppelt. Wenn dein Pro-Plan-Cap bisher X war, ist er jetzt ~2X. Pro, Max, Team, sitz-Enterprise — alle gleich. Anthropic publiziert die exakte Zahl nicht; das Cap ist algorithmisch und nutzungs-form-abhängig.
Peak-Hour-Reduktion weg für Pro und Max. Bis gestern bekam Pro/Max in den US-Hauptverkehrs-Stunden ein leise strengeres Cap. Das ist weg. Das Cap ist jetzt über den Tag uniform für Pro und Max.
API Tier 1 Opus Throughput-Sprung. Wenn du Opus über die API auf Tier 1 hittest, sind Input-Tokens-pro-Minute um etwa 1.500% gestiegen und Output-Tokens-pro-Minute um 900%. Das ist ein Step-Change für retrieval-lastige RAG-Workloads und für Eval-Suites — beides die wichtigsten Engpässe vieler kleiner Team-API-Kunden.
Was nicht
Wöchentliche Limits unverändert. Anthropic hat die Wochen-Cap explizit gehalten. Wenn dein eigentlicher Engpass das Wochen-Cap war (etwa 2 Stunden schwere Nutzung pro Tag über 5 Werktage), hilft die 5-Stunden-Verdopplung nicht.
Free-Plan unverändert. Wer auf Free gehofft hat, dass die Verdopplung mitgenommen wird — das ist nicht passiert.
Die 10-Minuten-Rechnung
Drei Zahlen, dann eine Entscheidung. Die Zeit, die ein Cappuccino braucht.
Schritt 1 — Wie sieht dein 5-Stunden-Cap-Schmerz aktuell aus?
Nimm die letzten 14 Werktage. Für jeden Tag eine Frage: hast du das 5-Stunden-Cap getroffen (die „Limit-erreicht"-Meldung gesehen) — und wenn ja, um welche Uhrzeit?
Drei Muster sind interessant:
- „Ich treffe das Cap meistens vor dem Mittag" — vor 12:00 Uhr deutscher Zeit. Das ist das Muster, das die Verdopplung am stärksten heilt. Dein effektives Cap verdoppelt sich, was das Cap-Treffen wahrscheinlich auf den Nachmittag schiebt oder ganz eliminiert.
- „Ich treffe das Cap an manchen Tagen am späten Nachmittag" — die Verdopplung hilft, aber prüfe das Wochen-Cap. Wenn das dein eigentlicher Engpass war, ändert die heutige Ankündigung nichts.
- „Ich treffe das Cap selten oder nie" — die Verdopplung ist für deine Spend-Rechnung irrelevant. Du warst schon unter dem Cap. Plan nicht ändern. (Siehe Gate 3 unten.)
Schritt 2 — Wie sieht deine Peak-Hour-Exposition aus?
Wenn du auf Pro oder Max bist und dein Arbeits-Muster ist „die schweren Claude-Code-Sessions liegen während der US-Hauptzeit" — die Peak-Hour-Entfernung ist die zweite Sache, die hilft. Das Cap ist jetzt über den Tag uniform; der Hack „ich verschiebe meine Nachmittags-Arbeit auf 23 Uhr, um die Peak-Hour-Reduktion zu umgehen" ist nicht mehr nötig.
Auf Team oder Enterprise traf die Peak-Hour-Reduktion ohnehin nicht zu — diese Änderung berührt dich nicht.
Schritt 3 — Wie sieht dein Opus-API-Muster aus (falls vorhanden)?
Wenn du Opus direkt über die API auf Tier 1 hittest, ist der Throughput-Sprung die größte der drei Veränderungen. Drei Workloads, wo das ein echter Step-Change ist:
- Long-Context Multi-Dokument-Retrieval (RAG-Stil): Input-Tokens-pro-Minute war der Engpass. Der 1.500%-Boost nimmt Long-Context-Workloads aus der Drosselung.
- Eval-Suites mit Parallel-Runs: Das neue Cap erlaubt 5-10× Parallelisierung gegenüber vorher.
- Agent- oder Tool-Use-Loops mit ausführlichem Trace-Output: Output-Tokens-pro-Minute war der sekundäre Engpass; der 900%-Boost nimmt auch das aus der Drosselung.
Zwei Workloads, wo es kein Step-Change ist:
- Latenz-kritisches Hot-Path-Serving: dein Engpass war nicht das Per-Minute-Cap, sondern Per-Call-Latenz. Heute ändert sich das nicht.
- Kleine-Kontext-Single-Turn-API-Calls: wenn du das Per-Minute-Cap nie getroffen hast, ändert das neue Cap nichts.
Die 3 „noch-nicht-upgraden"-Gates
Drei Muster, in denen die Verdopplung deine Rechnung nicht ändert — auch wenn die Schlagzeilen das Gegenteil suggerieren.
Gate 1 — Dein eigentlicher Engpass ist das Wochen-Cap
Das 5-Stunden-Cap ist die rollende Decke. Das Wochen-Cap ist die härtere. Anthropic hat das Wochen-Cap unverändert gehalten.
Wenn dein Team-Muster ist „wir treffen das Wochen-Cap am Mittwoch", erlaubt die 5-Stunden-Verdopplung dir am Montag und Dienstag schneller zu brennen — aber das Wochen-Cap am Mittwoch trifft dich trotzdem. Das Plan-Upgrade, das du wegen Wochen-Cap-Erleichterung in Erwägung gezogen hast, hat heute dieselbe Berechtigung wie gestern.
Gate 2 — Du routest schon mehr als 50% deiner Inferenz über Bedrock oder Vertex
Falls du bereits sinnvolle Workloads zu Anthropic-on-Bedrock oder Anthropic-on-Vertex migriert hast, ist die heutige Plan-Tier-Ratenlimit-Änderung für diese Workloads irrelevant. Bedrock und Vertex haben eigene Quota-Systeme, getrennt von den Plan-Caps.
Die Ausnahme: wenn deine Bedrock-Migration spezifisch durch den Ratenlimit-Schmerz auf Anthropic-direkt motiviert war, kann die heutige Ankündigung den Migrations-Kalkül umkehren. Re-evaluiere das Routing-Setup, bevor du den Migrations-Scope ausweitest.
Gate 3 — Du operierst schon unter dem alten Cap
Wenn dein 14-Tage-Muster zeigt, dass du das Cap nie getroffen hast, gibt dir die heutige Verdopplung doppelt so viel ungenutzten Headroom. An deinem Alltag und deiner Spend-Rechnung ändert sich nichts.
Der härteste Fall: ein Team mitten in einer Pro→Max-Upgrade-Diskussion, die mit „wir wollen Headroom zum Wachsen" begründet wurde. Das Headroom-Argument ist jetzt halb so teuer auf Pro zu erfüllen. Pause das Upgrade einen Monat, beobachte die tatsächliche Nutzung, dann entscheide.
Die 4 „heute-upgraden"-Muster
Vier Workloads, in denen die Verdopplung tatsächlich die Rechnung Richtung Plan-Upgrade oder anders-Routing verschiebt:
- Solo-Entwicklerin trifft das Pro-Cap meistens vor dem Mittag. Die Verdopplung lässt dich vermutlich länger auf Pro als geplant — aber wenn dein Muster zeigt, dass deine Arbeit natürlich wächst, gibt der Headroom dir jetzt ein Quartal mehr auf Pro statt Panik-Sprung zu Max.
- Team-Plan-Shop hat Non-Peak-Prod-Runs auf Nacht verlegt, um Peak-Hour-Reduktion zu umgehen. Die Peak-Hour-Entfernung kippt das. Hol diese Runs zurück in den Arbeitstag. Beobachte den Team-Throughput zwei Wochen, bevor du Sitze hinzufügst.
- Tier 1 Opus API-Nutzerin mit Hot-Path-latenz-kritischem Workload, der sekundär auf Per-Minute-Throughput beschränkt ist. Der 1.500%/900%-Throughput-Sprung ist der Unlock. Re-Benchmark deinen Hot-Path, bevor du auf Tier 2/3 springst.
- Enterprise-Sitz-Review für Mai oder Juni geplant. Die Per-Sitz-Rechnung mit dem neuen Cap neu durchziehen. Der Preis hat sich nicht geändert, aber was jeder Sitz liefert. Die meisten Renewal-Gespräche sollten für eine Re-Pricing-Runde pausieren, bevor unterschrieben wird.
Was das nicht löst
Vier ehrliche Grenzen, bevor du feierst.
- Das Wochen-Cap ist unverändert. Wenn dein eigentlicher Engpass das Wochen-Cap war, ändert heute nichts für dich.
- Der Free-Plan ist unverändert. Die Upgrade-Diskussion für Free-Nutzer ist heute gleich wie gestern.
- Der Tier-1-Opus-Boost gilt für Input/Output-Tokens-pro-Minute, nicht für Requests-pro-Minute. Dein API-Konkurrenz-Limit ist ein separates Cap.
- Die Cap-Verdopplung ist ‚ab heute’, aber Rollouts können 24-48h brauchen. Wenn du das neue Cap heute nicht in deiner Nutzung siehst, gib es übers Wochenende, bevor du ein Support-Ticket öffnest.
Die Quintessenz
Heute ist die größte einzelne Claude-Code-Ratenlimit-Änderung in der Produkt-Geschichte. Für Solo-Devs auf Pro, die mittags am Cap waren, eliminiert die Verdopplung wahrscheinlich die wachsende Panik in Richtung Max-Upgrade. Für Team- und Enterprise-Admins reduziert sie (ohne sie zu eliminieren) die Multi-Account-Split-Work-Hacks, die viele Teams als Workaround gefahren haben. Für Tier-1-Opus-API-Nutzer mit retrieval-lastigen Workloads ist der Throughput-Boost die Art von Veränderung, die das Re-Architekt der Eval-Suite oder RAG-Pipeline rechtfertigt.
Wenn du tiefer in das Tagesarbeit-Muster mit Claude Code einsteigen willst — Token-Sparen, Multi-Agent-Setups, die mit dem Cap spielen, Workflows, die den Ratenlimit-Schmerz strukturell vermeiden — deckt unser Kurs ChatGPT Meisterkurs den vollständigen Workflow ab.
Quellen
- Higher usage limits for Claude and a compute deal with SpaceX — Anthropic
- Anthropic verdoppelt Claude-Kapazität durch SpaceX-Partnerschaft — Börse-Express
- Anthropic is doubling Claude Code rate limits after deal with SpaceX — Engadget
- Anthropic doubles Claude Code limits, thanks to a deal with SpaceX — PCWorld
- Anthropic raises Claude Code and Opus API rate limits — TNW
- Reddit r/ClaudeCode: Doubled Rate Limits for Claude Code
- Claude hitches a ride on SpaceX’s datacenter capacity — The Register