~ / autor / lucas-souza-virgu $ whoami

Lucas Souza

{AI Engineer} — apaixonado por Laravel, arquitetura de software e construir produtos com impacto. Compartilho aqui tutoriais, descobertas e reflexões sobre o dia a dia de engenharia.

219 posts

49 #ia · #produtividade

Estudo da Microsoft: GitHub Copilot aumenta a produtividade do dev em 40% — o que o número esconde

Paper da Microsoft (maio/2026) mede +40,5% de PRs com GitHub Copilot em 16 mil engenheiros. Destrinchamos o que "produtividade" significa no estudo, o que o número esconde e como isso se compara a agentes como Claude Code e Cursor.

26 Jun · 8 min ›

50 #openai · #ia

OpenAI Daybreak: o GPT-5.5-Cyber que caça e corrige vulnerabilidades sozinho

A OpenAI liberou o GPT-5.5-Cyber dentro do programa Daybreak, um modelo que acha, valida e corrige vulnerabilidades num fluxo automatizado. O que ele faz na prática, onde entra no fluxo do dev e até onde dá pra confiar correção de vuln a um modelo.

25 Jun · 8 min ›

51 #ia · #claude

Anthropic vai exigir verificação de identidade no Claude? O que muda (e o que não) pra quem usa no Brasil

A Anthropic começou a pedir verificação de identidade por biometria no Claude e a comunidade surtou achando que era restrição de acesso. Calma: separamos o pânico do que é real, e o que isso significa pra dev no Brasil.

25 Jun · 8 min ›

52 #ia · #produtividade

CLAUDE.md: as 4 cláusulas do Karpathy e a 5ª que a comunidade adicionou

O post mais votado da semana no r/ClaudeAI partiu das 4 cláusulas de CLAUDE.md sugeridas pelo Karpathy e somou uma 5ª, a que mais muda o comportamento do agente. Um guia prático pra escrever um claude.md que o Claude Code realmente obedece.

25 Jun · 10 min ›

53 #ia · #llm

Mistral OCR 4: testei o novo modelo e ele lê PDF melhor que o ChatGPT?

A Mistral lançou o OCR 4 e ele foi pro topo do Hacker News. O que muda na extração de PDF, como compara com a leitura do ChatGPT/Gemini e quando vale plugar na sua stack.

24 Jun · 8 min ›

54 #ia · #llm

Mythos da Anthropic "invadiu a NSA em horas"? O que é fato e o que é boato

Viralizou a fala atribuída ao chefe da NSA de que o Mythos, modelo de fronteira da Anthropic, invadiu "quase todos" os sistemas classificados "em horas". O modelo é real. A acusação do hack, nem tanto. Separando fato de boato.

24 Jun · 7 min ›

55 #performance · #openai

OpenAI Codex bug: ele grava 640 TB/ano e pode matar seu SSD em menos de 1 ano

O Codex tem um sink de log em SQLite que roda em TRACE global e grava ~640 TB/ano, o suficiente pra queimar a vida útil de um SSD de 1 TB em menos de um ano. E ele ignora o RUST_LOG. Entenda a causa, diagnostique e pare o sangramento com uma linha.

23 Jun · 9 min ›

56 #ia · #llm

Fable 5 casos de uso: o que os EUA construíram nas 72h antes do bloqueio

Curadoria dos projetos reais que devs dos EUA construíram com o Claude Fable 5 nas primeiras 72 horas, antes de a Anthropic desligar o modelo por diretiva de controle de exportação dos EUA.

23 Jun · 9 min ›

57 #ia · #agentes

Sakana Fugu: o modelo que rege Fable 5 e Mythos sem treinar nenhum frontier

A Sakana AI lançou o Sakana Fugu: um LLM treinado para orquestrar um pool de outros modelos (chamar, delegar, verificar e sintetizar) atrás de uma única API compatível com OpenAI. Por que a tese de "capacidade frontier sem o risco de export controls" importa, e o que isso ensina sobre arquitetura de orquestração de agentes.

22 Jun · 8 min ›

58 #ia · #llm

GLM 5.2: o melhor modelo de código open source é chinês, MIT e 6x mais barato

A Z.ai (ex-Zhipu) lançou o GLM 5.2, modelo open-weight de 753B sob licença MIT que fica a 0,7 ponto do Claude Opus 4.8 em código e custa um sexto do preço por token. O que muda pra quem programa com IA no Brasil — incluindo rodar self-host.

22 Jun · 8 min ›

59 #openai · #ia

GPT 5.6 foi lançado: Sol, Terra e Luna, preços e tudo o que sabemos (rastreador)

O GPT 5.6 foi lançado em três modelos (Sol, Terra e Luna), com acesso restrito pelo governo dos EUA. O que se confirmou dos vazamentos, os preços e o que ainda é incógnita.

22 Jun · 9 min ›

60 #ia · #embeddings

RAG híbrido na prática: BM25, embeddings e reranker

Embedding sozinho erra mais do que você imagina. Veja como combinar busca lexical (BM25), busca semântica e um reranker cross-encoder para subir a qualidade do RAG em produção, com código em Python e LangChain.

21 Jun · 9 min ›