Claude Fable 5: 10 coisas que o Opus 4.8 não fazia bem
A Anthropic acabou de soltar o Claude Fable 5, e a conversa mudou de patamar. Não é "mais um upgrade incremental". É o primeiro modelo da classe Mythos liberado pra uso geral, e ele faz coisas que o Opus 4.8 — que até ontem era o teto — só fazia mal, ou nem fazia.
Esse post não é review de hype. É um inventário técnico: dez tarefas concretas que o Fable 5 resolve e que, na geração anterior, davam dor de cabeça, exigiam ferramenta externa ou simplesmente não fechavam.
Pra você que constrói software de verdade, a pergunta não é "o modelo é melhor?". É "o que eu consigo entregar hoje que ontem não dava?". Bora pra lista.
TL;DR
- O que é: Claude Fable 5, modelo classe Mythos da Anthropic liberado pra uso geral via API e planos pagos.
- Modelos/Stack: Fable 5 (com salvaguardas) e Mythos 5 (mesmo modelo, salvaguardas reduzidas, restrito a parceiros de cyber defesa e pesquisa em biologia).
- Custo/Acesso: US$ 10 por milhão de tokens de entrada, US$ 50 por milhão de saída. Menos da metade do preço do Mythos Preview. Incluído em Pro, Max, Team e Enterprise sem custo extra de 9 a 22 de junho de 2026.
- Link útil: Anúncio oficial da Anthropic
O contexto: por que o Claude Fable 5 muda o jogo?
Antes de sair listando, entenda o que mudou na base.
O Fable 5 e o Mythos 5 são o mesmo modelo por baixo. A diferença é a camada de salvaguarda: o Fable é o que você usa no dia a dia, com classificadores cobrindo cybersegurança, bio/química e destilação. O Mythos é a versão crua, liberada via Project Glasswing pra quem trabalha com defesa cibernética e pesquisa biológica. Pra 95% das sessões do Fable, nada disso aparece — não tem fallback pro Opus 4.8, é o Fable resolvendo direto.
E o pulo do gato é técnico de verdade. Segundo a Anthropic, o Fable 5 tem desempenho estado-da-arte em "praticamente todos os benchmarks testados" e supera qualquer modelo que eles já tinham disponibilizado — inclusive o Claude Opus 4.8, que a gente analisou há pouco e que era o teto pra quem entrega IA em produção. Ganhos grandes em raciocínio sobre documentos, leitura de tabelas e gráficos, e — o que mais importa pra quem escreve código — engenharia de software.
A seguir, as dez coisas que isso destrava na prática.
1. Migrar uma codebase gigante em um dia, não em dois meses
O caso que abre o anúncio é o da Stripe: o Fable 5 fez uma migração numa base Ruby de 50 milhões de linhas em um único dia. O mesmo trabalho levaria dois meses pra uma equipe.
Isso não é "autocomplete mais esperto". É o modelo segurando contexto de uma base inteira, entendendo dependências e aplicando uma transformação consistente em escala. Com o Opus 4.8, migração grande era um quebra-cabeça de janelas de contexto, chunking manual e revisão exaustiva pra garantir que o passo 4.000 não contradissesse o passo 12.
2. Reconstruir o código de um app a partir de screenshots
A capacidade de visão do Fable 5 é estado-da-arte, e o exemplo mais cabeludo: ele reconstruiu o código-fonte de um aplicativo web só a partir de prints da tela.
Pensa no que isso significa pro seu fluxo. Recebeu um mock no Figma, um screenshot de um concorrente, uma foto de uma tela legada sem código? O modelo agora consegue partir do pixel pro componente. O Opus 4.8 ajudava com layout aproximado; reconstrução fiel de estrutura a partir de imagem era território de alucinação.
3. Ler números exatos de gráficos e figuras científicas
Um dos ganhos mais subestimados está na interpretação de documentos. O Fable 5 extrai números precisos de figuras científicas — não estima "uns 40%", lê o valor certo no gráfico.
Pra quem constrói produto em cima de relatórios, papers, dashboards ou planilhas digitalizadas, isso é a diferença entre um pipeline confiável e um que você não pode deixar sozinho. Leitura de tabela e gráfico era exatamente um dos pontos onde o Opus 4.8 escorregava.
4. Manter o fio da meada por milhões de tokens
O Fable 5 sustenta foco numa mesma tarefa por milhões de tokens sem se perder. Isso é memória de longo contexto funcionando de verdade, não só uma janela grande no papel.
Na prática: agentes que rodam por horas, refactors que cruzam dezenas de arquivos, análise de logs gigantes. O problema clássico de modelo longo não era caber o texto — era lembrar do começo quando chegava no fim. O Opus 4.8 começava a derrapar. O Fable segura o raciocínio do início ao fim.
5. Performar 3x melhor em tarefa agêntica de longa duração
Tem número fechado pra essa. Rodando Slay the Spire com memória persistente, o Fable 5 teve desempenho 3x melhor que o Opus 4.8.
Por que um jogo importa pra você? Porque é um proxy honesto de tarefa agêntica longa: decisões encadeadas, estado que evolui, consequências de longo prazo. É o mesmo formato de um agente que opera um sistema por horas tomando decisões dependentes. Triplicar o desempenho aqui é sinal direto de agente mais confiável em produção.
6. Jogar (e terminar) só na visão, sem ferramenta auxiliar
O Fable 5 completou Pokémon FireRed usando apenas visão, sem nenhuma ferramenta de apoio. Sem API do jogo, sem leitura de memória — só olhando a tela e agindo.
Traduzindo pro mundo real: automação de interfaces que você não controla. Sistemas legados sem API, telas de terceiros, fluxos que só existem na GUI. Agente que enxerga e age sobre pixel abre uma categoria inteira de automação que com o Opus 4.8 dependia de gambiarra de OCR mais scripting frágil.
7. Refletir e validar o próprio trabalho
No esforço máximo, o Fable 5 reflete sobre e valida o próprio trabalho antes de entregar. Ele revisa o que produziu em vez de cuspir a primeira resposta plausível.
Isso ataca a dor número um de IA em produção: confiar na saída. Um cliente da Anthropic descreveu o resultado em redlines jurídicos como "visivelmente diferente". Pra dev, é menos "gerou e rezou", mais "gerou, checou e justificou". O Opus 4.8 fazia isso de forma rasa; aqui virou comportamento de fábrica no esforço alto.
8. Raciocínio sênior em documentos financeiros densos
No Hebbia Finance Benchmark, o Fable 5 tirou a maior pontuação entre todos os modelos em raciocínio de nível sênior.
Não é extrair um número de uma nota fiscal. É a análise que um analista experiente faria: cruzar tabelas, entender contexto de negócio, tirar conclusão defensável de um documento denso. Esse tipo de raciocínio document-based teve ganho substancial em relação ao Opus 4.8 — e é exatamente o que você precisa pra construir produto sobre dado financeiro real.
9. Entregar código frontier no esforço médio (e gastar menos token)
No FrontierCode, benchmark da Cognition, o Fable 5 teve a melhor pontuação entre os modelos frontier mesmo rodando no esforço médio.
Aqui mora engenharia de custo. Você não precisa estourar o esforço máximo — e o orçamento de tokens — pra ter código de ponta. O modelo entrega o estado-da-arte com menos esforço computacional, o que muda a conta de qualquer produto que roda código gerado em escala. A US$ 10 por milhão de entrada e US$ 50 de saída, esforço médio batendo frontier é dinheiro no bolso.
10. Gerar hipóteses científicas realmente novas
Essa é a mais fora da curva. O Fable 5 é o primeiro modelo a produzir consistentemente hipóteses científicas novas. Em comparações cegas, cientistas preferiram as hipóteses do modelo em cerca de 80% das vezes. Uma delas — um mecanismo inédito pra uma proteína da E. coli — foi corroborada num estudo.
Pra dev, o recado abstrai pra além da biologia: o modelo passou de "sintetiza o que existe" pra "propõe o que ainda não foi escrito". Em design de sistema, debugging de bug bizarro, exploração de arquitetura, isso é um colaborador que sugere caminho, não só executa ordem. O Opus 4.8 era ótimo recuperando e combinando; criar hipótese genuinamente nova era o limite.
Limitações e pontos de atenção
Nem tudo é foguete. Antes de jogar o Fable 5 em produção:
- Salvaguardas e fallback. O Fable encaminha certas solicitações pro Opus 4.8, e as salvaguardas disparam em menos de 5% das sessões. É pouco, mas se seu caso de uso encosta em cyber ofensivo ou bio/química dual-use, espere bloqueio.
- Mythos 5 não é pra você (ainda). A versão sem salvaguardas é restrita a parceiros Glasswing e pesquisadores de biologia. O que você usa é o Fable.
- Custo de saída. US$ 50 por milhão de tokens de saída não é trivial em volume. Esforço máximo com auto-validação consome mais. Meça antes de escalar.
- Benchmark não é produção. 3x num jogo e topo do FrontierCode são ótimos sinais, mas seu domínio tem suas próprias armadilhas. Avalie no seu dado.
FAQ rápido
Qual a diferença entre Fable 5 e Mythos 5? Mesmo modelo por baixo. Fable 5 tem salvaguardas e é liberado pra todo mundo via API e planos pagos. Mythos 5 tem salvaguardas reduzidas e é restrito a parceiros de defesa cibernética (via Project Glasswing) e pesquisa em biologia.
Quanto custa? US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de saída — menos da metade do preço do Mythos Preview. De 9 a 22 de junho de 2026 vem incluído em Pro, Max, Team e Enterprise por assento; a partir de 23 de junho passa a consumir créditos de uso.
Preciso trocar tudo do Opus 4.8 pro Fable 5? Depende do volume e do custo. Pra tarefas longas, visão e raciocínio sobre documento, o ganho é claro. Pra fluxos baratos e simples que já rodam bem, meça custo-benefício antes de migrar às cegas.
Funciona via API? Sim. Fable 5 está disponível imediatamente via API e nos planos pagos da Anthropic.
Conclusão
O Claude Fable 5 não é "o Opus 4.8 um pouco melhor". É um modelo que destrava categorias inteiras de trabalho — migração em escala, automação por visão, agente de longa duração, raciocínio sênior sobre documento — que antes eram gambiarra ou impossível.
Mas modelo bom não constrói produto sozinho. O salto não é ter acesso ao Fable 5. É saber transformar essa capacidade em arquitetura, contexto, avaliação e produto que aguenta produção. É disso que a gente fala de mão na massa no workshop Arquitetando Soluções de IA: como pegar um modelo de ponta e montar sistema de verdade em cima dele, sem cair no hype de prompt mágico.
A ferramenta evoluiu de novo. A pergunta que fica é a de sempre: você vai usar IA, ou vai construir com ela?
{AI Engineer} — apaixonado por Laravel, arquitetura de software e construir produtos com impacto. Compartilho aqui tutoriais, descobertas e reflexões sobre o dia a dia de engenharia.
Você também pode gostar
Claude Opus 4.8 chegou: o que muda de verdade pra quem entrega IA em produção
A Anthropic lançou o Claude Opus 4.8 hoje. Filtramos o que importa pra quem coda e roda agentes: liderança no SWE-Bench Pro, 84% em browser-agent, tool calling com menos passos, 4x menos bug sem comentar, multimodal 61% mais barato e Dynamic Workflows com centenas de subagentes no Claude Code, tudo no mesmo preço do 4.7.
Subagentes na prática: dividindo contexto entre Claudes para não estourar o token budget
Padrão pesquisador, executor e validador na prática. Por que três Claudes especializados batem um agente gigante em qualidade e travam menos no limite de contexto. Com números reais publicados pela Anthropic.
Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente
Agente nosso queimava US$ 2.300/mês rodando Claude Opus em loop. Trocamos por Plan-and-Execute: uma chamada cara que planeja, N chamadas baratas que executam. Conta nova: US$ 220/mês com a mesma qualidade. Planilha de tokens, código Laravel (PlanJob + ExecuteStep) e o tipo de fluxo onde esse pattern quebra.
O que é Harness Engineering e por que seu Claude Code trava em tarefas longas
Quando o agente esquece o que estava fazendo, repete trabalho ou alucina arquivos, raramente é falha do modelo. É falha do harness. Definição do termo, anatomia mínima (loop, tools, contexto, memória) e o ponto onde a maioria dos devs para de evoluir o setup.