#Ai Agents

Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente
Notícias

Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente

Agente nosso queimava US$ 2.300/mês rodando Claude Opus em loop. Trocamos por Plan-and-Execute: uma chamada cara que planeja, N chamadas baratas que executam. Conta nova: US$ 220/mês com a mesma qualidade. Planilha de tokens, código Laravel (PlanJob + ExecuteStep) e o tipo de fluxo onde esse pattern quebra.

· 10 min · Lucas Souza
MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente
Tutoriais

MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente

MCP local não é MCP em produção. Sair do stdio no laptop pra um servidor MCP servindo agente corporativo exige três mudanças: Streamable HTTP no transporte, OAuth 2.1 com PKCE e Resource Indicators na auth, e JSON Schema 2020-12 estrito nos argumentos. E um gateway corporativo no meio, sempre.

· 17 min · Lucas Souza
Multi-agent em Laravel: 3 padrões testados em produção (Orchestrator, Hierarchical, Swarm)
Tutoriais

Multi-agent em Laravel: 3 padrões testados em produção (Orchestrator, Hierarchical, Swarm)

Três arquiteturas multi-agent que sobreviveram a um projeto Laravel em produção: Orchestrator-Worker, Hierarchical e Swarm. Tem código real (Prism PHP, PrismAgents, Bus::batch, State Machine), o anti-padrão dos "4 prompts em paralelo" e o custo medido (hierarchical 30% mais barato).

· 12 min · Lucas Souza
Claude Opus 4.8 chegou: o que muda de verdade pra quem entrega IA em produção
Notícias

Claude Opus 4.8 chegou: o que muda de verdade pra quem entrega IA em produção

A Anthropic lançou o Claude Opus 4.8 hoje. Filtramos o que importa pra quem coda e roda agentes: liderança no SWE-Bench Pro, 84% em browser-agent, tool calling com menos passos, 4x menos bug sem comentar, multimodal 61% mais barato e Dynamic Workflows com centenas de subagentes no Claude Code, tudo no mesmo preço do 4.7.

· 8 min · Lucas Souza
Observabilidade de agentes de IA: LangSmith vs Langfuse vs Helicone (e o que cada um NÃO faz)
Tutoriais

Observabilidade de agentes de IA: LangSmith vs Langfuse vs Helicone (e o que cada um NÃO faz)

Mapa frio das três opções de LLM observability em maio de 2026 (uma delas em maintenance mode), com setup Langfuse self-hosted em Laravel e três métricas de agente que mudam o jogo.

· 12 min · Lucas Souza
Ferramentas de IA para dev backend: top 12 testadas em 90 dias de Laravel real
Notícias

Ferramentas de IA para dev backend: top 12 testadas em 90 dias de Laravel real

Review longa e opinada de 12 ferramentas de IA pra dev backend, depois de 90 dias rodando num Laravel real em produção. Nota 0-10, veredito em uma linha, e 5 que viralizaram mas não cumpriram.

· 15 min · Lucas Souza
Glossário do AI Engineer Vol.2: 20 termos NOVOS que apareceram em 2026 (que você não pode chegar sem saber)
Notícias

Glossário do AI Engineer Vol.2: 20 termos NOVOS que apareceram em 2026 (que você não pode chegar sem saber)

Em seis meses depois do Vol.1, vinte termos novos entraram no vocabulário dos times sérios de IA: context engineering, plan-and-execute, streamable HTTP MCP, AIDR, harness telemetry, world models, spec-driven dev. Cada um em duas ou três linhas, com exemplo concreto. Bônus: cinco que sumiram.

· 14 min · Lucas Souza
Vale a pena usar Cursor em 2026? 6 meses rodando Cursor, Claude Code e Windsurf lado a lado
Notícias

Vale a pena usar Cursor em 2026? 6 meses rodando Cursor, Claude Code e Windsurf lado a lado

Seis meses rodando Cursor, Claude Code e Windsurf no mesmo projeto Laravel. Pricing maio/2026, benchmarks, custo real em USD e veredito por persona: dev solo, time pequeno mixed-stack e time grande JS/TS.

· 10 min · Lucas Souza
Adoção segura de IA na empresa: EU AI Act + NIST RMF na prática (e o que o jurídico quer ver)
Tutoriais

Adoção segura de IA na empresa: EU AI Act + NIST RMF na prática (e o que o jurídico quer ver)

Em 2 de agosto de 2026 o EU AI Act entra na parte com dente: multa, fiscal, processo. Guia prático com os quatro níveis de risco traduzidos pra feature real, NIST AI RMF resumido, checklist técnico de 12 itens e template de AI Decision Record (AIDR) pronto pra colar no repo. Sem teoria de consultoria.

· 16 min · Lucas Souza
Google I/O 2026: 7 anúncios que mudam o trabalho do AI engineer brasileiro
Notícias

Google I/O 2026: 7 anúncios que mudam o trabalho do AI engineer brasileiro

Os sete movimentos de plataforma do Google I/O 2026 que mudam o trabalho do AI engineer brasileiro, com comparativo Gemini 3.5 Flash x Sonnet 4.5 x GPT-5.5 em três tarefas backend reais e o que ignorar do hype enterprise.

· 11 min · Lucas Souza
Quanto custa um agente em produção em 2026: planilha real depois de 6 meses
Notícias

Quanto custa um agente em produção em 2026: planilha real depois de 6 meses

A calculadora da OpenAI mente. Pricing de token é só um item de linha; a fatura real de um agente em produção tem seis baldes: inferência, eval em runtime, observability, infra, pessoas, outros. Este post abre o balancete de 6 meses, mês a mês, com números e fontes. No fim, build vs buy: quando vale construir e quando você está pagando para reinventar o Cursor.

· 15 min · Lucas Souza
Quando NÃO usar Agentic Code: 8 cenários onde o agente é prejuízo
Notícias

Quando NÃO usar Agentic Code: 8 cenários onde o agente é prejuízo

Curva de hype joga todo mundo no extremo. Aqui está a lista honesta de 8 cenários onde, em 2026, o agente custa mais caro, demora mais e ainda erra mais que o time fazendo na mão, com explicação técnica, benchmarks e dor de produção.

· 12 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando