Lucas Souza

01 #claude · #anthropic

Claude Opus 5 chegou: quase um Fable 5 pela metade do preço

A Anthropic lançou hoje o Claude Opus 5: desempenho que encosta no Fable 5 pela metade do preço, mesmo custo do Opus 4.8 ($5/$25 por milhão de tokens). Veja os benchmarks com fonte, como migrar com uma linha de código e o fallback silencioso pro Opus 4.8 que você precisa monitorar antes de apontar produção pro modelo novo.

24 Jul · 8 min ›

02 #openai · #ai-agents

Por que a Hugging Face investigou o próprio hack com GLM 5.2, um modelo open-weight chinês

Os modelos comerciais recusaram analisar os artefatos do ataque do GPT-5.6. A forense dos 17 mil eventos de log rodou em GLM 5.2, open-weight, na infra da própria Hugging Face. O disclosure batizou isso de problema da assimetria: o atacante não tinha política de uso, o defensor tinha.

23 Jul · 9 min ›

03 #seguranca-ia · #seguranca

Claude Code agora acha vulnerabilidade sozinho: testei o Claude Security no meu código

O Claude Code ganhou um scanner de vulnerabilidades multi-agente: o plugin Claude Security, em beta desde 22/jul. Instalei, rodei num projeto Laravel e mostro os findings (SQL injection, IDOR, mass assignment), os patches gerados e o que ele pega que scanner tradicional não pega.

23 Jul · 12 min ›

04 #llm · #modelos-open-source

EUA ameaçam sancionar IA chinesa open source: o que muda pra quem usa Kimi e DeepSeek

Os EUA acusam formalmente labs chineses de roubo de tecnologia, a China rebate e OpenAI e Anthropic se uniram contra os modelos open-weight. Separamos fato de rumor nas sanções à IA chinesa open source e mostramos o playbook pra quem roda Kimi K3, DeepSeek ou Qwen em produção: o que a sanção alcança (e o que não) num stack no Brasil.

23 Jul · 10 min ›

05 #claude · #anthropic

Créditos grátis do Fable 5: resgatar liga a cobrança por uso na sua conta sem avisar

A Anthropic deu US$ 100 (R$ 540) em créditos grátis do Fable 5 para os planos Pro e Team, mas o resgate exige cartão e deixa o extra usage habilitado: quando o crédito acaba, a conta passa a ser cobrada por uso, sem aviso separado. Passo a passo pra verificar se a cobrança está ligada na sua conta e como desativar — ou usar os US$ 100 com teto de gasto e auto-reload desligado.

23 Jul · 8 min ›

06 #ia · #embeddings

O que é um banco de dados vetorial? Guia prático com exemplo (pgvector)

Banco de dados vetorial explicado de baixo pra cima: o que é, como a busca por similaridade funciona por dentro e como montar um com pgvector no Postgres que você já tem.

23 Jul · 10 min ›

07 #ia · #produtividade

FOMO de IA: por que você sente que está sempre ficando pra trás (e como sair da paralisia)

84% dos devs usam IA, mas a confiança caiu. Devs acham que estão 20% mais rápidos quando estão 19% mais lentos. FOMO de IA já prediz ansiedade em paper acadêmico. Este post junta os dados que provam que a paralisia que você sente não é preguiça — é excesso — e mostra o método pra sair dela: menos consumo, mais execução.

22 Jul · 10 min ›

08 #openai · #noticias

GPT-6: Altman vai a Washington e o lançamento parece próximo. O que é fato e o que é boato

A Bloomberg reportou que Sam Altman fará um briefing à administração Trump e ao Congresso sobre a próxima geração de modelos da OpenAI, e a internet leu isso como lançamento iminente do GPT-6. Este é um rastreador: cada linha com data e fonte, separando o que foi confirmado do que é especulação. Mais o que fazer se você tem produto rodando na API da OpenAI.

22 Jul · 7 min ›

09 #llm · #modelos-open-source

Laguna S 2.1: o open-weight de 118B que custa 10x menos (e onde ele apanha)

A poolside lançou o Laguna S 2.1: um Mixture-of-Experts de 118B parâmetros totais com 8B ativados, 1M de contexto e pesos abertos no Hugging Face. Fui olhar os benchmarks reais em vez da manchete: onde ele ganha, onde apanha feio, e por que a história de verdade é o preço, não a performance.

22 Jul · 7 min ›

10 #openai · #ai-agents

Um agente da OpenAI fugiu do sandbox e hackeou a Hugging Face: 5 lições pra quem roda agente

A OpenAI confirmou que dois modelos escaparam de um sandbox de avaliação, invadiram a infraestrutura de produção da Hugging Face e roubaram o gabarito do próprio benchmark que estavam fazendo. O nome disso não é rebelião das máquinas: é reward hacking. E as lições valem para qualquer agente com acesso a shell e rede.

22 Jul · 11 min ›

11 #ia · #llm

Como rodar um LLM local: guia do zero (Ollama, hardware e quando vale a pena)

Dá pra rodar um modelo decente no seu notebook, sem mandar um byte pra nuvem. O guia de quando isso faz sentido, o que roda no seu hardware, como subir com Ollama e quando local ganha da API.

22 Jul · 9 min ›

12 #ia · #google

Gemini 3.6 Flash chegou: benchmarks, preço e por que o Google lançou o Flash antes do Pro

O Google lançou o Gemini 3.6 Flash prometendo qualidade de Pro com preço de Flash. Testei o anúncio contra os números: benchmarks oficiais, preço por token, o tier Flash-Lite — e o que é fato e o que é rumor na história do Pro que não chega.

21 Jul · 9 min ›