Dois meses atrás, a Anthropic construiu um modelo de IA e decidiu que ele era perigoso demais para ser vendido. Ele encontrava sozinho falhas de segurança desconhecidas em todos os grandes sistemas operacionais e navegadores — então foi trancado a sete chaves, acessível só para uns 200 parceiros verificados.
Ontem, esse mesmo modelo apareceu no app do Claude. Com uma jaula em volta.
O Claude Fable 5 é o modelo de IA mais capaz que o público já pôde usar, com uma vantagem que surpreendeu até quem vive de acompanhar benchmark. E é também o lançamento mais estranho do ano: custa o dobro do modelo anterior, certas perguntas são respondidas em silêncio por outro modelo, e quem assina o Claude só tem ele incluído no plano até 22 de junho. O Olhar Digital resumiu o impacto numa manchete: a nova IA reduz dois meses de trabalho a um dia. Aqui vai o quadro completo — e, mais importante, o que você faz com essas duas semanas grátis.
O que é o Claude Fable 5, afinal
A versão curta: o Fable 5 é o modelo “Mythos” da Anthropic vestindo um colete de segurança.
A versão longa começa em 7 de abril, quando a Anthropic anunciou um modelo de fronteira chamado Claude Mythos Preview e se recusou a lançá-lo. Não era jogada de marketing: o modelo descobria sozinho vulnerabilidades zero-day — falhas de segurança que ninguém conhece ainda — e as transformava em ataques funcionais. Segundo a Anthropic, ele encontrou bugs críticos em todos os grandes sistemas operacionais e navegadores, 99% deles desconhecidos até então. O instituto britânico de segurança de IA (AISI) avaliou por conta própria: o Mythos completou 73% das tarefas de cibersegurança de nível especialista que, um ano antes, nenhum modelo conseguia nem começar.
Em vez de lançamento público, o Mythos entrou num programa fechado chamado Project Glasswing — Apple, Google, Microsoft, Nvidia, AWS e, no fim, cerca de 200 organizações em mais de 15 países, todas usando o modelo para achar e corrigir as próprias falhas antes dos atacantes. A Anthropic ainda colocou até 100 milhões de dólares em créditos de uso para bancar as correções.
O Fable 5, lançado em 9 de junho, é a porta de entrada para o resto de nós. Nas palavras da Anthropic: um modelo classe Mythos “que tornamos seguro para uso geral”. Mesmo cérebro, regras diferentes.
Os números que fizeram todo mundo arregalar o olho
Benchmark nunca é a história inteira, mas essa tabela de lançamento nem foi disputa. No SWE-bench Pro — a versão mais difícil e à prova de decoreba do teste padrão de programação com problemas reais do GitHub — o Fable 5 marcou 80,3%, primeiro modelo a passar dos 80. O carro-chefe anterior da própria Anthropic, o Claude Opus 4.8, está em 69,2%. O GPT-5.5 da OpenAI faz 58,6%, e o Gemini 3.1 Pro do Google, 54,2%.

A tabela oficial do lançamento. As linhas com estrela são onde as proteções do Fable 5 entram em ação — esses números refletem o Mythos 5 sem restrições. Fonte: Anthropic
E o padrão se repete bem além do código — a parte que quase ninguém cobriu:
| Benchmark (o que mede) | Fable 5 / Mythos 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro (programação real) | 80,3% | 69,2% | 58,6% | 54,2% |
| GDPval-AA (trabalho de escritório, Elo) | 1932 | 1890 | 1769 | 1314 |
| Humanity’s Last Exam, sem ferramentas | 59,0%* | 49,8% | 41,4% | 44,4% |
| Legal Agent Benchmark (trabalho jurídico) | 13,3% | 10,4% | 2,1% | 0,0% |
| OSWorld-Verified (uso de computador) | 85,0% | 83,4% | 78,7% | 76,2% |
| Terminal-Bench 2.1 (trabalho agêntico) | 88,0% | 82,7% | 83,4% | 70,7% |
* Os números com estrela incluem casos de transferência para o Opus — veja a seção da jaula.
Duas linhas merecem tradução. O GDPval mede entregas reais de escritório — os memorandos, análises e relatórios de 44 profissões. Aquela diferença de 1932 contra 1769 do GPT-5.5 é o benchmark do “seu trabalho de verdade”, não um teste de programador. E no Legal Agent Benchmark todos os números parecem ridiculamente baixos porque a prova é brutal — mas a ordem importa: 13,3% contra 2,1% é seis vezes mais em trabalho jurídico agêntico.
Os relatos do mundo real chegam rápido. A manchete do Olhar Digital veio direto de um caso da Stripe: uma migração de 50 milhões de linhas de código, orçada em mais de dois meses de trabalho de equipe, comprimida em um dia. E o agregador independente Artificial Analysis colocou o Fable 5 em primeiro lugar no seu Intelligence Index, com 64,9 pontos — uns cinco acima do melhor modelo que não é da Anthropic. Em índice composto, cinco pontos é muita coisa.
A jaula: como a Anthropic “domesticou” o Mythos
Essa é a parte realmente inédita do lançamento — e onde mora a polêmica. O sistema de segurança do Fable 5 tem duas camadas que funcionam de jeitos completamente diferentes.
A camada um é visível. Modelos classificadores separados vigiam cada solicitação. Quando detectam uma pergunta de três categorias — cibersegurança ofensiva, biologia e química, ou tentativas de extrair as capacidades do modelo para treinar um concorrente —, o Fable 5 não responde. Quem responde é o Claude Opus 4.8, e você fica sabendo. Pense num especialista que repassa certas perguntas a um colega em vez de se recusar na cara dura. A Anthropic diz que mais de 95% das sessões nunca acionam o mecanismo; a Artificial Analysis mediu uns 8% durante os benchmarks, principalmente nos testes científicos. A lógica está num único número: em testes de desenvolvimento de exploits, o Mythos 5 sem jaula faz 78% onde o Opus 4.8 faz 40%. Esses 38 pontos de vantagem são exatamente o que a Anthropic não quer entregar de bandeja para atacantes.
A camada dois é invisível — e é por causa dela que os especialistas estão brigando. Enterrado na system card: para pedidos sobre construir IA de fronteira — pipelines de pré-treinamento, infraestrutura de treino distribuído, design de aceleradores —, o Fable 5 não recusa nem repassa. Ele responde com eficácia deliberadamente limitada, usando técnicas como steering vectors e prompts modificados, sem avisar. A Anthropic estima que isso toca ~0,03% do tráfego, concentrado em menos de 0,1% das organizações.
A crítica, vinda de gente que no geral é fã, é afiada. Nathan Lambert, do Allen Institute for AI — que no mesmo texto chamou o Fable 5 de “o modelo mais inteligente disponível ao público” —, escreveu que “um modelo de IA que fica automaticamente menos inteligente sem me avisar é IA categoricamente desalinhada”. A preocupação de fundo: uma recusa você vê, uma transferência você avalia, mas uma resposta degradada em silêncio deixa o pesquisador sem saber se a ideia dele falhou, se o código falhou ou se o modelo fez corpo mole.
O contraponto justo: a coisa está documentada — foi assim que todo mundo descobriu —, a fatia de tráfego é minúscula, e a política mira exatamente os atores que menos respeitam termos de serviço. Para a esmagadora maioria das profissões, não muda nada. Mas o precedente agora existe, e a notícia é essa.
Um último detalhe escondido no lançamento: todo o tráfego da classe Mythos carrega uma retenção obrigatória de dados de 30 dias — até para empresas com contrato de retenção zero. A Anthropic diz que é para caçar ataques novos e jailbreaks, não para treinar modelo. Se você lida com dados sensíveis de clientes, vale conversar com o jurídico antes de rotear esse tipo de trabalho por lá.
O preço, e a pegadinha do 22 de junho
O Fable 5 custa 10 dólares por milhão de tokens de entrada e 50 por milhão de saída — exatamente o dobro do Opus 4.8 e menos da metade do que a Mythos Preview custava para os primeiros parceiros. A janela de contexto (1 milhão de tokens, umas 750 mil palavras de memória de trabalho) e a resposta máxima (128 mil tokens) continuam as mesmas. A inteligência subiu; o recipiente, não.
Para quem usa API e paga por consumo, fim de papo: está disponível, paga pelo uso, pronto.
Para os milhões de assinantes do Claude Pro, Max e Team, tem um relógio correndo. O Fable 5 está incluído nos planos pagos sem custo extra só até 22 de junho — gastando sua cota de uso duas vezes mais rápido que o Opus —, e a partir de 23 de junho passa para créditos de uso separados, até voltar “como parte padrão quando a capacidade permitir”. Sem data marcada.
Essa janela de duas semanas gerou uma discussão mais barulhenta que os benchmarks. Uma tese viral decretou a morte da assinatura fixa de IA: a economia dos modelos de fronteira não aguentaria mais o rodízio à vontade, e créditos de uso seriam o futuro que todo mundo vai copiar. A leitura mais calma: a Anthropic precificou honestamente a computação classe Mythos, foi atropelada pela demanda do lançamento e está racionando até as GPUs darem conta. As duas podem ser verdade. O fato prático não muda: a degustação grátis acaba em 22 de junho.
O que ele não faz
- Ser barato ou rápido. O dobro do preço é real, os primeiros usuários relatam tempos de raciocínio longos, e execuções agênticas de 40+ minutos já aparecem nas faturas. Para a pergunta rápida do dia a dia, é a ferramenta errada — tipo contratar engenheiro estrutural para pendurar quadro.
- Ganhar de todo mundo em tudo. A Andon Labs rodou o Mythos 5 sem jaula na sua simulação de negócios Vending-Bench e ele faturou menos que o Opus 4.7 e o GPT-5.5. Um time, um benchmark — mas um ótimo antídoto contra a euforia de lançamento.
- Deixar em paz quem trabalha com segurança. O classificador cibernético é conservador, e dev fazendo trabalho perfeitamente defensivo já está caindo no fallback do Opus.
- Garantir que continua na sua assinatura em julho. “Volta quando a capacidade permitir” é intenção, não data.
Fable 5 ou Opus 4.8: qual usar na prática?
O Opus 4.8 não sumiu e, pela metade do preço, segue sendo a escolha sensata para a maior parte do trabalho:
| Sua tarefa | Use |
|---|---|
| Escrita do dia a dia, e-mails, resumos | Opus 4.8 — Fable é exagero |
| Pesquisa ou análise longa, em várias etapas | Fable 5 — a diferença aparece na profundidade |
| Programação séria, debugging, migrações | Fable 5 — aqui ele humilha o resto |
| Documentos complexos: finanças, jurídico, PDFs densos | Fable 5 — os números de GDPval e jurídico são a prova |
| Pesquisa de segurança, temas bio/químicos | Opus 4.8 direto — o Fable repassaria de qualquer jeito |
| Tarefas automatizadas em volume, com orçamento curto | Opus 4.8 ou Haiku — token acumula rápido |
O que isso significa para você
Se você já paga Claude Pro, Max ou Team: tem até 22 de junho para descobrir — sem custo extra — se a diferença importa para o seu trabalho. Não desperdice a janela com papo que qualquer modelo responde igual. Entregue sua tarefa real mais difícil: a análise da planilha caótica, o contrato de 80 páginas, o relatório que você vem empurrando. Se o resultado fizer você se ajeitar na cadeira, já sabe se os créditos valerão a pena depois. Se não, o Opus 4.8 continua excelente e incluído.
Se você usa ChatGPT e bateu a curiosidade: a distância para o GPT-5.5 é a maior vantagem que um laboratório abre em uns dois anos — mas ela se concentra em trabalho profundo, agêntico, de fôlego longo. Se o seu uso de IA é conversa, você não vai sentir. Se você espreme os modelos em entregas profissionais de verdade, este é o raro momento em que “testa o outro” tem dados por trás, não só hype.
Se você avalia ferramentas de IA para uma empresa: dois detalhes discretos pesam mais que os benchmarks. A retenção obrigatória de 30 dias atropela acordos de retenção zero nos modelos classe Mythos — confirme com o compliance antes de rotear trabalho sensível. E a troca de assinatura por créditos é um sinal de preço que a indústria inteira está observando: orce IA de fronteira por consumo, não como assentos fixos para sempre.
Se você nunca usou IA pra valer: nada nesse lançamento muda seu ponto de partida — os planos grátis do Claude e do ChatGPT continuam sendo a sala de aula certa, e um modelo caro assim é para quem já sabe o que faria com ele. Mas guarde o que acabou de acontecer: a IA mais poderosa já vendida agora roda com outras IAs de olho nela. Essa arquitetura — capacidade mais vigias — é a cara dos próximos anos.
Resumo da ópera
O Claude Fable 5 é duas histórias em uma. A primeira é capacidade bruta: o maior salto de geração em anos, com provas em programação, trabalho de escritório, finanças e direito — e uma janela de duas semanas para assinante testar de graça. A segunda é o precedente: o primeiro modelo de fronteira cujo perigo não foi administrado segurando o lançamento, mas lançando dentro de uma malha de classificadores, fallbacks, regras de retenção e limites silenciosos. A primeira história é o motivo para testar antes de 22 de junho. A segunda é o motivo pelo qual esse lançamento será lembrado muito depois de os benchmarks envelhecerem.
Se a pergunta “qual modelo para qual trabalho” é a que sempre trava você, nosso curso Claude em português para iniciantes resolve isso na prática — e o ChatGPT para todos constrói essa base do zero. As duas primeiras aulas de cada um são grátis.
Fontes
- Claude Fable 5 and Claude Mythos 5 — Anthropic
- Claude Fable 5: nova IA da Anthropic reduz dois meses de trabalho a um dia — Olhar Digital
- Anthropic lança modelos avançados Fable 5 e Mythos 5 para o Claude — MacMagazine
- Anthropic lança o Claude Fable 5, sua inteligência artificial mais poderosa — Times Brasil/CNBC
- Our evaluation of Claude Mythos Preview’s cyber capabilities — UK AI Security Institute
- Project Glasswing: Securing critical software for the AI era — Anthropic
- Claude Fable 5 and new safety fables — Interconnects (Nathan Lambert)