Você está no meio de uma conversa. A IA finalmente está sendo útil de verdade. E aí aparece: “Você atingiu seu limite. Tente de novo em 3 horas.”
Se isso vem acontecendo mais este ano do que no ano passado, não é impressão. A verdade meio dura de 2026 é essa: não existe mais um plano de IA realmente ilimitado — nem no ChatGPT, nem no Gemini, nem no Claude, nem nos planos de 200 dólares por mês. Todo plano tem um teto em algum lugar. As empresas só não gostam de colocar isso em destaque na página de preços.
Então vamos desenhar o mapa. Para onde foi o “ilimitado”, quais são os limites reais em 2026, por que isso aconteceu e o que você faz a respeito.
O que “ilimitado” significava — e por que caiu
Dois ou três anos atrás, pagar por IA parecia quase um rodízio à vontade. De vez em quando você batia numa parede, mas a maioria nunca via nenhuma. Isso nunca foi sustentável.
O que nunca apareceu na página de marketing: cada mensagem custa dinheiro real para a empresa em poder de processamento — e os modelos novos que “pensam” custam muito mais por resposta do que os antigos. Some a nova onda de “agentes” automatizados que disparam milhares de pedidos por dia sem ninguém por perto, e o preço fixo deixou de fazer sentido. Os limites voltaram, só que com palavras mais suaves.
O mapa de limites 2026 (o que você recebe de verdade)
Os números mudam, mas é mais ou menos assim em meados de 2026. Encare como “aproximadamente”, não como lei.
ChatGPT
- Grátis: cerca de 10 mensagens a cada 5 horas no modelo principal; depois você cai para um modelo “mini” menor.
- Plus (US$ 20/mês): cerca de 160 mensagens a cada 3 horas no modelo de ponta, mais um teto semanal separado (~3.000) para o modelo pesado de raciocínio “Thinking”.
- Pro (~US$ 200/mês): bem mais, mas também não é infinito.
Google Gemini
- Usa limites por processamento em vez de uma contagem simples de mensagens. O Google definiu novos limites de uso do Gemini em todos os planos — o que conta não é quantas vezes você aperta enviar, mas quanto recurso cada interação consome, afetando inclusive quem usa de graça.
Anthropic Claude
- Grátis: acesso ao Claude Sonnet 4.6 com cerca de 10 a 20 mensagens por janela de 5 horas, variando conforme a demanda.
- Pro/Max: um limite semanal sobre todos os modelos mais um limite de sessão de 5 horas, ambos visíveis nas Configurações. E em 15 de junho de 2026 a Anthropic moveu o uso automatizado (agentes, SDK) para um crédito separado — mas se você só conversa com o Claude no site, no app ou no terminal, pra você não muda nada.
O padrão nos três: o usuário casual quase nunca chega ao teto. O usuário pesado bate o tempo todo. É feito assim de propósito — os limites miram nos 5% mais pesados.
Por que isso aconteceu (a versão honesta)
Três forças, todas na mesma direção:
- Processamento é caro e os bons modelos são famintos. Quanto mais esperto e “pensante” o modelo, mais cara cada resposta.
- Infraestrutura não é de graça. GPUs, data centers, energia. O usuário pesado consome mais do que o plano cobre.
- Os agentes mudaram a conta. Uma única conta paga pode rodar software automatizado que faz milhares de pedidos por dia. Preço fixo não sobrevive a isso.
Juntando tudo, “ilimitado por 20 dólares” sempre ia acabar. Só acabou no silêncio, em nota de rodapé, em vez de com um anúncio.
O que isso significa para você
Se você é usuário casual (umas perguntas de vez em quando) — sinceramente, você quase não percebe. Você não é o alvo desses limites. Não pague por medo um plano que não precisa.
Se você é usuário pesado (sessões longas, documentos grandes, muita troca de mensagens) — é você que bate na parede. A solução quase nunca é “pagar mais”, e sim distribuir a carga: modelo leve para o rotineiro, e um segundo assistente grátis como transbordo.
Se está na dúvida se vale subir de plano — suba quando bater no teto com frequência em trabalho que importa, não porque o grátis parece mão de vaca. O salto de grátis para US$ 20 vale a pena para quase todo mundo que usa IA para trabalhar de verdade. O salto para US$ 200 é para uma minoria muito pesada.
O que esse mapa não resolve
- Não faz os limites sumirem. Essa é a direção de toda a indústria agora. Modelos locais e alternar entre provedores são os truques — não existe plano ilimitado secreto.
- Os números exatos mudam. As empresas ajustam em silêncio, o tempo todo. Encare como sensação — sua própria página de Configurações mostra seu consumo real.
- Não diz qual ferramenta é “a melhor”. Elas estão mais próximas do que o marketing sugere.
- Não conta os tokens por você — para isso fizemos uma ferramenta grátis: o Contador de Tokens de IA faz a conta pro ChatGPT, Claude, Gemini e mais.
Resumo
A “IA ilimitada” foi um momento curto, lindo e financeiramente impossível — e acabou. Em 2026 todo plano tem um teto. O truque é saber mais ou menos onde fica o seu e trabalhar com ele, em vez de se chocar de surpresa.
Escolha o modelo certo para a tarefa, tenha um segundo assistente à mão e suba de plano só quando o teto travar trabalho de verdade. Se quiser dominar a IA pra valer — em vez de só administrar os limites — comece com ChatGPT para Todos ou ChatGPT Agents & Projects. As duas primeiras aulas são grátis, sem cadastro.