Claude Code : limites doublées, le calcul Q3 (mai 2026)

Si vous avez passé les six derniers mois à dire à votre équipe « on réévaluera Claude Code quand Anthropic aura réglé les limites » — ce jour, c’est aujourd’hui.

Hier après-midi (6 mai 2026), Anthropic a annoncé un accord de calcul avec SpaceX et son datacenter Colossus 1 à Memphis : plus de 300 mégawatts de capacité, plus de 220 000 GPU NVIDIA dans le mois. (KultureGeek) Trois changements entrent en vigueur dès aujourd’hui :

Les limites 5 heures de Claude Code sont doublées pour les plans Pro, Max, Team et Enterprise par siège
La réduction aux heures de pointe est supprimée pour Pro et Max
Les limites Tier 1 Opus de l’API sont nettement relevées — la couverture indique environ +1 500% sur les input tokens par minute et +900% sur les output tokens par minute

Le plan Free reste inchangé. Les caps hebdomadaires aussi.

Une nuance importante : Anthropic a publié l’annonce officielle avec un tableau de récap, mais sans diffuser de chiffres exacts avant/après en tokens-par-minute lisibles par machine. (Anthropic — higher limits) Les premiers retours r/ClaudeCode du 6 mai sont mitigés — certains utilisateurs voient le doublement net, au moins un commentateur a rapporté que son quota effectif « semble avoir été réduit de moitié par rapport à la semaine dernière » et a renvoyé vers usage.report comme tracker tiers. Comptez sur un fenêtre de 24-72h pour que les nouveaux chiffres se stabilisent dans tous les comptes. (r/ClaudeCode)

Si vous êtes manager d’ingénierie en train de revoir le budget Q3, ou solo dev qui hésite entre Pro et Max, voici le calcul de 10 minutes à faire aujourd’hui — et les trois portes de garde « ne pas upgrader le plan tout de suite » qui restent valables même avec le doublement.

Ce qui a changé (et ce qui n’a pas)

Cinq points dans l’annonce. Trois comptent pour votre calcul aujourd’hui ; deux sont des signaux à surveiller ce trimestre.

Ce qui passe en prod aujourd’hui

Le cap 5h sur les plans payants est doublé. Si votre cap Pro était X auparavant, il est maintenant ~2X. Pro, Max, Team, Enterprise par siège — tous égaux. Anthropic ne publie pas le chiffre exact ; il est algorithmique et dépend du shape d’usage.

La réduction aux heures de pointe est supprimée pour Pro et Max. Jusqu’à hier, Pro et Max avaient un cap discrètement plus serré pendant les heures US business. C’est terminé. Le cap est uniforme sur la journée pour Pro et Max.

Le throughput Tier 1 Opus a fait un saut. Si vous tapez Opus via l’API en Tier 1, les input-tokens-par-minute ont monté d’environ 1 500% et les output-tokens-par-minute de 900%. C’est un step-change pour les workloads RAG long-context et les eval suites — exactement les contraintes binding pour beaucoup d’API customers en petite équipe.

Ce qui n’a pas changé

Limites hebdomadaires inchangées. Anthropic a explicitement maintenu le cap hebdo. Si votre vrai goulot d’étranglement était le cap hebdo (deux heures de gros usage par jour sur 5 jours ouvrés), le doublement 5h ne vous aide pas.

Free inchangé. Si vous étiez en Free en espérant que le doublement ferait ricochet — non.

Le calcul de 10 minutes

Trois chiffres, puis une décision. Le temps d’un café.

Étape 1 — Quel est votre pattern actuel sur le cap 5h ?

Prenez les 14 derniers jours ouvrés. Pour chaque jour, une question : avez-vous touché le cap 5h (vu le message « limit reached »), et si oui, à quelle heure ?

Trois patterns à distinguer :

« Je touche le cap avant midi presque tous les jours » — c’est le pattern que le doublement guérit le plus fort. Votre plafond effectif double, ce qui repousse l’heure du cap-hit à milieu d’après-midi ou l’élimine complètement.
« Je touche le cap milieu d’après-midi certains jours » — le doublement aide, mais regardez la section « ce qui n’a pas changé » : si votre vrai goulot était le cap hebdo, l’annonce d’aujourd’hui ne bouge rien.
« Je touche rarement ou jamais le cap » — le doublement est sans effet sur votre calcul. Vous étiez déjà sous le plafond. Ne changez pas de plan. (Voir Garde 3 ci-dessous.)

Étape 2 — Quelle est votre exposition aux heures de pointe ?

Si vous êtes sur Pro ou Max et que votre pattern est « je fais mes gros runs Claude Code pendant les heures business US », la suppression de la réduction aux heures de pointe est la deuxième chose qui aide. Le cap est maintenant uniforme — le hack « j’ai déplacé mes gros runs à 23h pour éviter la pénalité de pointe » n’est plus nécessaire.

Si vous êtes sur Team ou Enterprise, la réduction aux heures de pointe ne s’appliquait déjà pas — ce changement ne vous concerne pas.

Étape 3 — Quel est votre pattern Opus API (si vous en avez un) ?

Si vous tapez Opus directement en API Tier 1, le saut de throughput est le plus grand des trois changements. Trois workloads où c’est un step-change réel :

Retrieval long-context multi-document (style RAG) : input-tokens-par-minute était la contrainte binding. Le boost +1 500% sort les workloads long-context du throttle.
Eval suites avec runs parallèles : le nouveau plafond permet de paralléliser 5-10× ce que vous tourniez avant.
Boucles agent ou tool-use avec output trace verbeux : output-tokens-par-minute était la contrainte secondaire ; le boost +900% l’enlève aussi.

Deux workloads où ce n’est pas un step-change :

Serving hot-path latence-critique : votre contrainte n’était pas le plafond par minute mais la latence par appel. L’annonce d’aujourd’hui ne change pas ça.
Single-turn API calls petit contexte : si vous ne touchiez jamais le plafond par minute, le nouveau plafond est sans effet.

Les 3 portes « ne-pas-upgrader-tout-de-suite »

Trois patterns où le doublement ne change PAS votre calcul, même si les titres prétendent le contraire :

Porte 1 — Votre vrai goulot d’étranglement est le cap hebdo

Le cap 5h est le plafond glissant. Le cap hebdo est le plafond plus dur. Anthropic a maintenu le cap hebdo.

Si le pattern de votre équipe est « on touche le cap hebdo le mercredi », doubler le cap 5h vous laisse brûler plus vite lundi-mardi — mais vous touchez toujours le cap hebdo le mercredi. L’upgrade de plan que vous envisagiez pour soulager le cap hebdo a la même justification aujourd’hui qu’hier.

Porte 2 — Vous routez déjà >50% de l’inférence vers Bedrock ou Vertex

Si vous avez déjà migré du workload significatif vers Anthropic-on-Bedrock ou Anthropic-on-Vertex, le changement de plan-tier rate-limits aujourd’hui est sans effet sur ce workload. Bedrock et Vertex ont leurs propres systèmes de quotas, séparés des plans.

L’exception : si votre migration vers Bedrock était spécifiquement motivée par la douleur des limites sur Anthropic-direct, l’annonce d’aujourd’hui peut renverser le calcul de migration. Reconsidérez la décision de routing avant d’étendre le scope.

Porte 3 — Vous êtes déjà sous le cap actuel

Si votre pattern 14 jours montre que vous ne touchez jamais le cap, le doublement d’aujourd’hui vous donne deux fois plus de marge inutilisée. Ça ne change rien à votre quotidien et rien à votre calcul de spend.

Le cas le plus dur : une équipe en pleine discussion d’upgrade Pro→Max justifiée par « on veut de la marge pour grossir ». L’argument marge est maintenant deux fois moins cher à satisfaire sur Pro. Mettez l’upgrade en pause un mois, regardez le shape d’usage réel, puis décidez.

Les 4 patterns « upgrader-aujourd’hui »

Quatre workloads où l’annonce d’aujourd’hui change vraiment le calcul vers un upgrade ou un re-routing :

Solo dev qui touche le cap Pro avant midi presque tous les jours. Le doublement vous garde probablement sur Pro plus longtemps que prévu — mais si votre pattern montre une vraie croissance, la marge vous donne un trimestre de plus sur Pro plutôt qu’un saut panique vers Max.
Team plan qui avait déplacé les gros runs prod en pleine nuit pour éviter la pénalité de pointe. La suppression de la pénalité renverse ça. Ramenez ces runs dans la journée. Surveillez le throughput global de l’équipe deux semaines avant d’ajouter des sièges.
Utilisateur Tier 1 Opus API avec workload hot-path latence-critique secondairement contraint sur le throughput par minute. Le saut +1 500%/+900% est le déblocage. Re-benchmarkez votre hot-path avant de décider de rester sur Tier 1 ou de monter sur Tier 2/3.
Review de sièges Enterprise prévue pour mai ou juin. Refaites le calcul par siège avec le nouveau plafond. Le prix n’a pas changé, mais ce que chaque siège délivre, oui. La plupart des conversations de renouvellement devraient se mettre en pause pour un re-pricing avant signature.

Ce que ça ne règle pas

Cinq limites honnêtes avant de fêter.

Le cap hebdo est inchangé. Si votre vrai goulot était le cap hebdo, aujourd’hui ne change rien pour vous.
Le plan Free est inchangé. Si vous étiez sur Free en espérant que le doublement ferait ricochet — non.
Le boost Tier 1 Opus est sur les input/output tokens-par-minute, pas sur les requests-par-minute. Votre limite de concurrence au niveau API est un plafond séparé.
Le doublement « effective today » mais le rollout peut prendre 24-48h. Si vous ne voyez pas le nouveau plafond aujourd’hui, attendez le week-end avant d’ouvrir un ticket de support.
La capacité Colossus 1 arrive « dans le mois ». L’histoire de capacité d’Anthropic pour mai-juillet est plus saine que celle d’avril ; la deuxième moitié de l’année dépend de comment le rampage SpaceX se déroule.

La conclusion

L’annonce d’aujourd’hui est le plus gros changement de rate-limits Claude Code de l’histoire du produit. Pour les solo devs sur Pro qui touchaient le cap en milieu de journée, le doublement élimine probablement la panique qui montait vers un upgrade Max. Pour les Team et Enterprise admins, ça réduit (sans éliminer) les hacks multi-comptes que beaucoup d’équipes faisaient en sourdine. Pour les utilisateurs Tier 1 Opus API avec workloads retrieval-lourds, le saut de throughput est le genre de changement qui justifie de re-architecturer comment votre eval suite ou pipeline RAG batch le travail.

L’exercice de 10 minutes à faire ce matin : sortir le pattern cap-hit des 14 derniers jours, identifier laquelle des trois changements « what landed today » correspond à votre goulot, et vérifier les trois portes « pas-upgrader-tout-de-suite » avant de cliquer sur le bouton upgrade.

Si vous voulez creuser le quotidien de Claude Code en daily driver — patterns qui économisent des tokens, setups multi-agents qui jouent bien avec le cap, workflows qui survivent à la falaise des limites — notre cours ChatGPT vs Claude couvre le setup complet incluant le calcul des limites.

Claude Code : les limites sont doublées — le calcul Q3 en 10 minutes

Table des Matières