Claude Fable 5: o que é e por que testar grátis até 22 de junho

Claude Fable 5 explicado: a história do Mythos, benchmarks reais contra o GPT-5.5, a jaula de segurança de duas camadas e como testar grátis até 22 de junho.

Dois meses atrás, a Anthropic construiu um modelo de IA e decidiu que ele era perigoso demais para ser vendido. Ele encontrava sozinho falhas de segurança desconhecidas em todos os grandes sistemas operacionais e navegadores — então foi trancado a sete chaves, acessível só para uns 200 parceiros verificados.

Ontem, esse mesmo modelo apareceu no app do Claude. Com uma jaula em volta.

O Claude Fable 5 é o modelo de IA mais capaz que o público já pôde usar, com uma vantagem que surpreendeu até quem vive de acompanhar benchmark. E é também o lançamento mais estranho do ano: custa o dobro do modelo anterior, certas perguntas são respondidas em silêncio por outro modelo, e quem assina o Claude só tem ele incluído no plano até 22 de junho. O Olhar Digital resumiu o impacto numa manchete: a nova IA reduz dois meses de trabalho a um dia. Aqui vai o quadro completo — e, mais importante, o que você faz com essas duas semanas grátis.

O que é o Claude Fable 5, afinal

A versão curta: o Fable 5 é o modelo “Mythos” da Anthropic vestindo um colete de segurança.

A versão longa começa em 7 de abril, quando a Anthropic anunciou um modelo de fronteira chamado Claude Mythos Preview e se recusou a lançá-lo. Não era jogada de marketing: o modelo descobria sozinho vulnerabilidades zero-day — falhas de segurança que ninguém conhece ainda — e as transformava em ataques funcionais. Segundo a Anthropic, ele encontrou bugs críticos em todos os grandes sistemas operacionais e navegadores, 99% deles desconhecidos até então. O instituto britânico de segurança de IA (AISI) avaliou por conta própria: o Mythos completou 73% das tarefas de cibersegurança de nível especialista que, um ano antes, nenhum modelo conseguia nem começar.

Em vez de lançamento público, o Mythos entrou num programa fechado chamado Project Glasswing — Apple, Google, Microsoft, Nvidia, AWS e, no fim, cerca de 200 organizações em mais de 15 países, todas usando o modelo para achar e corrigir as próprias falhas antes dos atacantes. A Anthropic ainda colocou até 100 milhões de dólares em créditos de uso para bancar as correções.

O Fable 5, lançado em 9 de junho, é a porta de entrada para o resto de nós. Nas palavras da Anthropic: um modelo classe Mythos “que tornamos seguro para uso geral”. Mesmo cérebro, regras diferentes.

Os números que fizeram todo mundo arregalar o olho

Benchmark nunca é a história inteira, mas essa tabela de lançamento nem foi disputa. No SWE-bench Pro — a versão mais difícil e à prova de decoreba do teste padrão de programação com problemas reais do GitHub — o Fable 5 marcou 80,3%, primeiro modelo a passar dos 80. O carro-chefe anterior da própria Anthropic, o Claude Opus 4.8, está em 69,2%. O GPT-5.5 da OpenAI faz 58,6%, e o Gemini 3.1 Pro do Google, 54,2%.

Tabela oficial de benchmarks da Anthropic para o Claude Mythos 5 e o Fable 5: SWE-Bench Pro em 80,3% contra 69,2% do Opus 4.8 e 58,6% do GPT-5.5, com vantagens em trabalho de conhecimento, uso de computador, direito e biologia
Benchmarks de lançamento do Claude Fable 5

A tabela oficial do lançamento. As linhas com estrela são onde as proteções do Fable 5 entram em ação — esses números refletem o Mythos 5 sem restrições. Fonte: Anthropic

E o padrão se repete bem além do código — a parte que quase ninguém cobriu:

Benchmark (o que mede)Fable 5 / Mythos 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-bench Pro (programação real)80,3%69,2%58,6%54,2%
GDPval-AA (trabalho de escritório, Elo)1932189017691314
Humanity’s Last Exam, sem ferramentas59,0%*49,8%41,4%44,4%
Legal Agent Benchmark (trabalho jurídico)13,3%10,4%2,1%0,0%
OSWorld-Verified (uso de computador)85,0%83,4%78,7%76,2%
Terminal-Bench 2.1 (trabalho agêntico)88,0%82,7%83,4%70,7%

* Os números com estrela incluem casos de transferência para o Opus — veja a seção da jaula.

Duas linhas merecem tradução. O GDPval mede entregas reais de escritório — os memorandos, análises e relatórios de 44 profissões. Aquela diferença de 1932 contra 1769 do GPT-5.5 é o benchmark do “seu trabalho de verdade”, não um teste de programador. E no Legal Agent Benchmark todos os números parecem ridiculamente baixos porque a prova é brutal — mas a ordem importa: 13,3% contra 2,1% é seis vezes mais em trabalho jurídico agêntico.

Os relatos do mundo real chegam rápido. A manchete do Olhar Digital veio direto de um caso da Stripe: uma migração de 50 milhões de linhas de código, orçada em mais de dois meses de trabalho de equipe, comprimida em um dia. E o agregador independente Artificial Analysis colocou o Fable 5 em primeiro lugar no seu Intelligence Index, com 64,9 pontos — uns cinco acima do melhor modelo que não é da Anthropic. Em índice composto, cinco pontos é muita coisa.

A jaula: como a Anthropic “domesticou” o Mythos

Essa é a parte realmente inédita do lançamento — e onde mora a polêmica. O sistema de segurança do Fable 5 tem duas camadas que funcionam de jeitos completamente diferentes.

A camada um é visível. Modelos classificadores separados vigiam cada solicitação. Quando detectam uma pergunta de três categorias — cibersegurança ofensiva, biologia e química, ou tentativas de extrair as capacidades do modelo para treinar um concorrente —, o Fable 5 não responde. Quem responde é o Claude Opus 4.8, e você fica sabendo. Pense num especialista que repassa certas perguntas a um colega em vez de se recusar na cara dura. A Anthropic diz que mais de 95% das sessões nunca acionam o mecanismo; a Artificial Analysis mediu uns 8% durante os benchmarks, principalmente nos testes científicos. A lógica está num único número: em testes de desenvolvimento de exploits, o Mythos 5 sem jaula faz 78% onde o Opus 4.8 faz 40%. Esses 38 pontos de vantagem são exatamente o que a Anthropic não quer entregar de bandeja para atacantes.

A camada dois é invisível — e é por causa dela que os especialistas estão brigando. Enterrado na system card: para pedidos sobre construir IA de fronteira — pipelines de pré-treinamento, infraestrutura de treino distribuído, design de aceleradores —, o Fable 5 não recusa nem repassa. Ele responde com eficácia deliberadamente limitada, usando técnicas como steering vectors e prompts modificados, sem avisar. A Anthropic estima que isso toca ~0,03% do tráfego, concentrado em menos de 0,1% das organizações.

A crítica, vinda de gente que no geral é fã, é afiada. Nathan Lambert, do Allen Institute for AI — que no mesmo texto chamou o Fable 5 de “o modelo mais inteligente disponível ao público” —, escreveu que “um modelo de IA que fica automaticamente menos inteligente sem me avisar é IA categoricamente desalinhada”. A preocupação de fundo: uma recusa você vê, uma transferência você avalia, mas uma resposta degradada em silêncio deixa o pesquisador sem saber se a ideia dele falhou, se o código falhou ou se o modelo fez corpo mole.

O contraponto justo: a coisa está documentada — foi assim que todo mundo descobriu —, a fatia de tráfego é minúscula, e a política mira exatamente os atores que menos respeitam termos de serviço. Para a esmagadora maioria das profissões, não muda nada. Mas o precedente agora existe, e a notícia é essa.

Um último detalhe escondido no lançamento: todo o tráfego da classe Mythos carrega uma retenção obrigatória de dados de 30 dias — até para empresas com contrato de retenção zero. A Anthropic diz que é para caçar ataques novos e jailbreaks, não para treinar modelo. Se você lida com dados sensíveis de clientes, vale conversar com o jurídico antes de rotear esse tipo de trabalho por lá.

O preço, e a pegadinha do 22 de junho

O Fable 5 custa 10 dólares por milhão de tokens de entrada e 50 por milhão de saída — exatamente o dobro do Opus 4.8 e menos da metade do que a Mythos Preview custava para os primeiros parceiros. A janela de contexto (1 milhão de tokens, umas 750 mil palavras de memória de trabalho) e a resposta máxima (128 mil tokens) continuam as mesmas. A inteligência subiu; o recipiente, não.

Para quem usa API e paga por consumo, fim de papo: está disponível, paga pelo uso, pronto.

Para os milhões de assinantes do Claude Pro, Max e Team, tem um relógio correndo. O Fable 5 está incluído nos planos pagos sem custo extra só até 22 de junho — gastando sua cota de uso duas vezes mais rápido que o Opus —, e a partir de 23 de junho passa para créditos de uso separados, até voltar “como parte padrão quando a capacidade permitir”. Sem data marcada.

Essa janela de duas semanas gerou uma discussão mais barulhenta que os benchmarks. Uma tese viral decretou a morte da assinatura fixa de IA: a economia dos modelos de fronteira não aguentaria mais o rodízio à vontade, e créditos de uso seriam o futuro que todo mundo vai copiar. A leitura mais calma: a Anthropic precificou honestamente a computação classe Mythos, foi atropelada pela demanda do lançamento e está racionando até as GPUs darem conta. As duas podem ser verdade. O fato prático não muda: a degustação grátis acaba em 22 de junho.

O que ele não faz

  • Ser barato ou rápido. O dobro do preço é real, os primeiros usuários relatam tempos de raciocínio longos, e execuções agênticas de 40+ minutos já aparecem nas faturas. Para a pergunta rápida do dia a dia, é a ferramenta errada — tipo contratar engenheiro estrutural para pendurar quadro.
  • Ganhar de todo mundo em tudo. A Andon Labs rodou o Mythos 5 sem jaula na sua simulação de negócios Vending-Bench e ele faturou menos que o Opus 4.7 e o GPT-5.5. Um time, um benchmark — mas um ótimo antídoto contra a euforia de lançamento.
  • Deixar em paz quem trabalha com segurança. O classificador cibernético é conservador, e dev fazendo trabalho perfeitamente defensivo já está caindo no fallback do Opus.
  • Garantir que continua na sua assinatura em julho. “Volta quando a capacidade permitir” é intenção, não data.

Fable 5 ou Opus 4.8: qual usar na prática?

O Opus 4.8 não sumiu e, pela metade do preço, segue sendo a escolha sensata para a maior parte do trabalho:

Sua tarefaUse
Escrita do dia a dia, e-mails, resumosOpus 4.8 — Fable é exagero
Pesquisa ou análise longa, em várias etapasFable 5 — a diferença aparece na profundidade
Programação séria, debugging, migraçõesFable 5 — aqui ele humilha o resto
Documentos complexos: finanças, jurídico, PDFs densosFable 5 — os números de GDPval e jurídico são a prova
Pesquisa de segurança, temas bio/químicosOpus 4.8 direto — o Fable repassaria de qualquer jeito
Tarefas automatizadas em volume, com orçamento curtoOpus 4.8 ou Haiku — token acumula rápido

O que isso significa para você

Se você já paga Claude Pro, Max ou Team: tem até 22 de junho para descobrir — sem custo extra — se a diferença importa para o seu trabalho. Não desperdice a janela com papo que qualquer modelo responde igual. Entregue sua tarefa real mais difícil: a análise da planilha caótica, o contrato de 80 páginas, o relatório que você vem empurrando. Se o resultado fizer você se ajeitar na cadeira, já sabe se os créditos valerão a pena depois. Se não, o Opus 4.8 continua excelente e incluído.

Se você usa ChatGPT e bateu a curiosidade: a distância para o GPT-5.5 é a maior vantagem que um laboratório abre em uns dois anos — mas ela se concentra em trabalho profundo, agêntico, de fôlego longo. Se o seu uso de IA é conversa, você não vai sentir. Se você espreme os modelos em entregas profissionais de verdade, este é o raro momento em que “testa o outro” tem dados por trás, não só hype.

Se você avalia ferramentas de IA para uma empresa: dois detalhes discretos pesam mais que os benchmarks. A retenção obrigatória de 30 dias atropela acordos de retenção zero nos modelos classe Mythos — confirme com o compliance antes de rotear trabalho sensível. E a troca de assinatura por créditos é um sinal de preço que a indústria inteira está observando: orce IA de fronteira por consumo, não como assentos fixos para sempre.

Se você nunca usou IA pra valer: nada nesse lançamento muda seu ponto de partida — os planos grátis do Claude e do ChatGPT continuam sendo a sala de aula certa, e um modelo caro assim é para quem já sabe o que faria com ele. Mas guarde o que acabou de acontecer: a IA mais poderosa já vendida agora roda com outras IAs de olho nela. Essa arquitetura — capacidade mais vigias — é a cara dos próximos anos.

Resumo da ópera

O Claude Fable 5 é duas histórias em uma. A primeira é capacidade bruta: o maior salto de geração em anos, com provas em programação, trabalho de escritório, finanças e direito — e uma janela de duas semanas para assinante testar de graça. A segunda é o precedente: o primeiro modelo de fronteira cujo perigo não foi administrado segurando o lançamento, mas lançando dentro de uma malha de classificadores, fallbacks, regras de retenção e limites silenciosos. A primeira história é o motivo para testar antes de 22 de junho. A segunda é o motivo pelo qual esse lançamento será lembrado muito depois de os benchmarks envelhecerem.

Se a pergunta “qual modelo para qual trabalho” é a que sempre trava você, nosso curso Claude em português para iniciantes resolve isso na prática — e o ChatGPT para todos constrói essa base do zero. As duas primeiras aulas de cada um são grátis.

Fontes

Build Real AI Skills

Step-by-step courses with quizzes and certificates for your resume