~ / autor / lucas-souza-virgu $ whoami

Lucas Souza

{AI Engineer} — apaixonado por Laravel, arquitetura de software e construir produtos com impacto. Compartilho aqui tutoriais, descobertas e reflexões sobre o dia a dia de engenharia.

220 posts

73 #openai · #ia

Codex CLI: como usar goals para guiar o agente sem microgerenciar

O recurso /goal do Codex CLI faz o agente da OpenAI perseguir um objetivo sozinho. Aprenda a escrever um goal como contrato — com escopo, verificação e condição de parada — em vez de um prompt com esperança embutida.

17 Jun · 10 min ›

74 #ia · #ai-agents

Sistemas multiagentes: arquitetura e orquestração assíncrona na prática

O que são sistemas multiagentes, quando vale dividir o trabalho em vários agentes e como orquestrar de forma assíncrona com asyncio. Arquitetura orquestrador-worker, o padrão de produção da Anthropic e quando NÃO dividir.

16 Jun · 10 min ›

75 #ia · #ai-agents

Ferramentas de engenharia de contexto que eu uso em produção

Lista prática e opinativa das ferramentas de engenharia de contexto que seguram um agente em produção: gestão de janela, compressão, recuperação e observabilidade. Com APIs nativas, números reais e o que dá errado.

16 Jun · 10 min ›

76 #ia · #embeddings

Agentic RAG: quando seu RAG precisa virar agente

RAG tradicional busca uma vez e reza. Agentic RAG decide quando buscar, o que buscar e quando parar. Veja a diferença real, com números de paper, e monte o loop de decisão sem explodir o custo.

16 Jun · 9 min ›

77 #ia · #llm

Claude Opus 4.8 vs Minimax M3 vs Qwen 3: paguei caro, paguei barato e rodei de graça

Construí o mesmo encurtador de links três vezes, sem mão humana no código, com Opus 4.8 (US$100/mês), Minimax M3 (US$20) e Qwen 3.6 local na RTX 4080. Tempo, resultado e veredito honesto sobre pago, barato e de graça.

15 Jun · 9 min ›

78 #ia · #ai-agents

Claude -p vai morrer: como migrar para o Claude Agent SDK

O modo headless claude -p está sendo substituído pelo Claude Agent SDK. Guia prático de migração: o que muda no uso com seu plano Claude e como rodar agentes headless do jeito novo.

15 Jun · 11 min ›

79 #ia · #llm

Fable 5 bloqueado: o OpenRouter Fusion prova que painel de modelos já supera qualquer frontier

O Claude Fable 5 durou três dias disponível antes de ser bloqueado pelo governo dos EUA. Enquanto isso, o OpenRouter publicou dados que mudam a pergunta: e se painel de modelos baratos já superar qualquer frontier solo em deep research?

15 Jun · 7 min ›

80 #ia · #agentes

O que é Harness de IA? O ambiente que faz seu agente parar de travar

O harness é o ambiente que roda o agente — loop, ferramentas, estado e guardrails. É ele, não o modelo, que decide se seu agente aguenta produção ou trava na primeira tarefa de verdade.

15 Jun · 8 min ›

81 #openai · #cache

Reduzir custo de API de IA: os vazamentos de token mais comuns

Sua conta de API de IA veio 4x maior do que o previsto? Antes de cortar feature, vamos achar os cinco vazamentos de token mais comuns em produção e o conserto de cada um.

14 Jun · 10 min ›

82 #produtividade · #claude

Prompt para gerar código: 8 padrões que tiram o ar de tutorial genérico da IA

A IA gera código que funciona, mas parece copiado de um tutorial de 2021. Oito padrões de prompt para gerar código que segue o padrão do SEU projeto, não o exemplo genérico. Direto das docs da Anthropic e do Claude Code.

13 Jun · 11 min ›

83 #agentes · #pgvector

Por que o agente esquece tudo: como dar memória de verdade ao seu agente de IA

Seu agente de IA começa do zero a cada sessão porque o modelo é stateless. Entenda por que ele esquece, a diferença entre memória de curto e longo prazo, e como dar memória de verdade sem complexidade desnecessária.

13 Jun · 11 min ›

84 #rag · #llm

Estourou o limite de tokens do ChatGPT: por que a IA esquece e como resolver

A IA não esquece por burrice. É a janela de contexto. Entenda pela dor o limite de tokens e as quatro saídas: resumo, RAG, chunking e memória.

13 Jun · 10 min ›