Mythos da Anthropic invadiu a NSA "em horas"? Fato vs boato

"Não em semanas. Em horas."

A frase atribuída ao chefe da NSA sobre o modelo interno da Anthropic correu o mundo em questão de dias. Print no X, manchete em portal de segurança, thread viral com 2 milhões de views. O enredo é perfeito: uma IA secreta tão boa que invadiu "quase todos" os sistemas classificados do governo americano antes do café esfriar.

O problema é que quase ninguém consegue confirmar que a frase é real do jeito que foi vendida.

E é aí que a história do Mythos da Anthropic fica interessante de verdade — não pelo hack, mas pelo que ela ensina sobre ler notícia de IA sem cair no primeiro print que aparece na timeline.

Vamos separar o que é fato do que é boato.

O Mythos da Anthropic existe — e isso é fato

Antes de qualquer coisa: o modelo é real.

A Anthropic anunciou o Claude Mythos Preview em 7 de abril de 2026. É um modelo de fronteira que a empresa decidiu não lançar publicamente. Em vez de subir na API pra qualquer um, ele foi distribuído via Project Glasswing para um grupo fechado de parceiros de segurança defensiva.

A razão do confinamento é a parte que assusta. O Mythos não é um chatbot melhorzinho. É um modelo que encontra e explora vulnerabilidades de software num nível acima da maioria dos especialistas humanos. Os números da própria Anthropic:

Identificou falhas em "todo grande sistema operacional e todo grande navegador" quando recebeu a tarefa.
Escreveu exploits autônomos completos — incluindo uma cadeia "JIT heap spray" que escapou do sandbox do renderizador e do sistema operacional.
Montou um exploit de NFS no FreeBSD com uma "cadeia ROP de 20 gadgets sobre múltiplos pacotes", sem mão humana no meio.
Num teste de exploits de JavaScript no Firefox, gerou 181 exploits funcionais contra os 2 do Opus 4.6, partindo das mesmas tentativas.

Pra fechar o quadro: o UK AI Security Institute avaliou o Mythos em tarefas de hacking de nível especialista e reportou 73% de sucesso — em tarefas que, até abril de 2025, nenhum modelo conseguia completar.

Aqui o conceito vira impacto de produto. Um modelo que acha zero-day em escala industrial é uma arma de dois gumes literal: a mesma capacidade que blinda software defende e ataca. Como o defensor precisa acertar sempre e o atacante precisa acertar uma vez só, a Anthropic optou por dar vantagem ao defensor primeiro. Por isso o Glasswing, por isso o preço salgado de acesso fechado ($25 por milhão de tokens de entrada, $125 na saída).

Então sim: existe um modelo da Anthropic absurdamente bom em segurança ofensiva. Isso não é boato. É a base de tudo que veio depois.

A frase que viralizou

Agora a parte que pegou fogo.

Em 11 de junho de 2026, o senador Mark Warner, vice-presidente do Comitê de Inteligência do Senado americano, contou que o general Joshua Rudd — chefe da NSA e do Cyber Command — teria dito a ele, pessoalmente, que o Mythos "invadiu quase todos os nossos sistemas classificados, não em semanas, mas em horas".

A fala foi publicada primeiro pela The Economist, pelo editor de defesa Shashank Joshi. Daí pra frente foi ladeira abaixo na velocidade do retweet.

Repara na cadeia: o general falou pro senador, o senador falou em público, o jornalista publicou, a internet recortou. Quatro elos. Cada um deles é um ponto onde contexto vaza. E vazou muito.

O que é boato (ou, no mínimo, não confirmado)

Aqui a história desmonta — não porque o Mythos seja fraco, mas porque a frase viral deixou de fora tudo que importa.

Primeiro: não foi invasão. Foi exercício autorizado. O detalhe que sumiu nos prints é que isso foi um red team nas próprias redes da NSA. Um teste contratado, com permissão, na infraestrutura do governo. Não foi uma IA rebelde furando firewall do lado de fora. Foi exatamente o trabalho pro qual o Glasswing existe.

Segundo: o próprio jornalista pediu calma. Shashank Joshi, que publicou a citação, veio a público dizer que a frase não deve ser lida literalmente. Segundo ele, o resultado dependeu do Mythos operando "junto com outras ferramentas, em condições específicas". Ou seja: não foi o modelo sozinho digitando "hackear NSA" e o Pentágono abrindo.

Terceiro: nenhuma agência confirmou. Até agora, nenhum órgão do governo americano ratificou publicamente a versão do hack relâmpago. É testemunho de segunda mão num corredor do Senado, não relatório técnico.

Quarto: a comunidade reagiu na lata. O CEO da BitGo, Mike Belshe, foi direto: "I'm calling BS on this." Analistas e jornalistas de segurança questionaram o enredo. A leitura mais sóbria é que a vulnerabilidade destacada envolvia pedir pro modelo ler código e apontar falhas — e o que apareceu foram bugs menores, já documentados, que modelos rivais como o GPT-5.5 também acham.

E tem a ironia final: o que de fato tirou o Mythos do ar não foi nenhuma "fuga". Foi um jailbreak sinalizado pela Amazon somado a diretrizes de controle de exportação dos EUA. Burocracia e política, não Skynet.

O método pra não ser enganado por print de IA

Tira o Mythos da equação por um segundo, porque o padrão aqui se repete em toda notícia quente de IA.

A frase viral comprime três coisas distintas em uma só:

Capacidade real do modelo (alta — isso é fato).
Contexto do teste (autorizado, com outras ferramentas, condições específicas — isso some no recorte).
Spin de quem conta (senador em ano de debate sobre regulação de IA tem incentivo pra dramatizar — isso ninguém marca como tal).

Quem constrói produto com IA precisa fazer essa separação no automático. "Red team autorizado encontrou falhas" e "IA invadiu o governo" são frases com a mesma capacidade técnica por trás e implicações completamente opostas. Uma é o sistema funcionando como projetado. A outra é manchete.

O teste mental é simples: antes de repassar, pergunte quem afirmou, com base em quê, e o que foi omitido entre a fonte e o seu feed. No caso do Mythos, a resposta é general → senador → jornalista → print, com o "foi autorizado" caindo no caminho. Isso muda tudo.

É esse tipo de leitura crítica — separar capacidade de contexto de narrativa — que vira músculo de quem trabalha com esses modelos no dia a dia. É o mesmo ceticismo que a gente aplica quando olha prompt injection em agentes que raspam a web: a manchete é o ataque espetacular, mas a engenharia está nos detalhes de em que condições aquilo de fato roda. E é o mesmo raciocínio que separa um agente que vai pra produção de um que só impressiona numa demo: no workshop Do Prompt ao Harness: construindo um Agent de Vendas, do AI Engineering LAB, a gente monta um agente de vendas de ponta a ponta — do prompt cru até o harness que sustenta o sistema rodando de verdade, com as mesmas perguntas sobre o que o modelo faz, em que condições, e onde a coisa quebra.

O veredito

Fato: o Mythos é real, é assustadoramente capaz em segurança ofensiva, e a Anthropic levou isso a sério o bastante pra não lançar.

Boato: a versão de que ele "invadiu a NSA em horas" como se fosse um ataque autônomo e espontâneo. Foi teste autorizado, com ferramentas de apoio, condições montadas, e nenhuma confirmação oficial — com o próprio autor da citação pedindo pra não levar ao pé da letra.

A diferença entre os dois não é detalhe. É a diferença entre entender o que a IA de fronteira realmente faz e repetir manchete que alguém recortou pra ganhar timeline.

Surfar a notícia rápido é ótimo. Surfar sem checar a fonte é como deployar em produção sem teste: funciona até a hora que não funciona.

Mythos da Anthropic "invadiu a NSA em horas"? O que é fato e o que é boato

O Mythos da Anthropic existe — e isso é fato

A frase que viralizou

O que é boato (ou, no mínimo, não confirmado)

O método pra não ser enganado por print de IA

O veredito

Você também pode gostar

Anthropic vai exigir verificação de identidade no Claude? O que muda (e o que não) pra quem usa no Brasil

Fable 5 casos de uso: o que os EUA construíram nas 72h antes do bloqueio

Claude Fable 5: 10 coisas que o Opus 4.8 não fazia bem

Prompt injection no agente: quando o site raspado vira o novo system prompt