#Ai Agents

37 #ia · #ai-agents

MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente

MCP local não é MCP em produção. Sair do stdio no laptop pra um servidor MCP servindo agente corporativo exige três mudanças: Streamable HTTP no transporte, OAuth 2.1 com PKCE e Resource Indicators na auth, e JSON Schema 2020-12 estrito nos argumentos. E um gateway corporativo no meio, sempre.

29 Mai · 17 min ›

38 #laravel · #agentes

Multi-agent em Laravel: 3 padrões testados em produção (Orchestrator, Hierarchical, Swarm)

Três arquiteturas multi-agent que sobreviveram a um projeto Laravel em produção: Orchestrator-Worker, Hierarchical e Swarm. Tem código real (Prism PHP, PrismAgents, Bus::batch, State Machine), o anti-padrão dos "4 prompts em paralelo" e o custo medido (hierarchical 30% mais barato).

28 Mai · 12 min ›

39 #ia · #ai-agents

Claude Opus 4.8 chegou: o que muda de verdade pra quem entrega IA em produção

A Anthropic lançou o Claude Opus 4.8 hoje. Filtramos o que importa pra quem coda e roda agentes: liderança no SWE-Bench Pro, 84% em browser-agent, tool calling com menos passos, 4x menos bug sem comentar, multimodal 61% mais barato e Dynamic Workflows com centenas de subagentes no Claude Code, tudo no mesmo preço do 4.7.

28 Mai · 8 min ›

40 #ai-agents · #observabilidade

Observabilidade de agentes de IA: LangSmith vs Langfuse vs Helicone (e o que cada um NÃO faz)

Mapa frio das três opções de LLM observability em maio de 2026 (uma delas em maintenance mode), com setup Langfuse self-hosted em Laravel e três métricas de agente que mudam o jogo.

28 Mai · 12 min ›

41 #laravel · #php

Ferramentas de IA para dev backend: top 12 testadas em 90 dias de Laravel real

Review longa e opinada de 12 ferramentas de IA pra dev backend, depois de 90 dias rodando num Laravel real em produção. Nota 0-10, veredito em uma linha, e 5 que viralizaram mas não cumpriram.

27 Mai · 15 min ›

42 #openai · #ia

Glossário do AI Engineer Vol.2: 20 termos NOVOS que apareceram em 2026 (que você não pode chegar sem saber)

Em seis meses depois do Vol.1, vinte termos novos entraram no vocabulário dos times sérios de IA: context engineering, plan-and-execute, streamable HTTP MCP, AIDR, harness telemetry, world models, spec-driven dev. Cada um em duas ou três linhas, com exemplo concreto. Bônus: cinco que sumiram.

26 Mai · 14 min ›

43 #ai-agents · #produtividade

Vale a pena usar Cursor em 2026? 6 meses rodando Cursor, Claude Code e Windsurf lado a lado

Seis meses rodando Cursor, Claude Code e Windsurf no mesmo projeto Laravel. Pricing maio/2026, benchmarks, custo real em USD e veredito por persona: dev solo, time pequeno mixed-stack e time grande JS/TS.

26 Mai · 10 min ›

44 #ia · #ai-agents

Adoção segura de IA na empresa: EU AI Act + NIST RMF na prática (e o que o jurídico quer ver)

Em 2 de agosto de 2026 o EU AI Act entra na parte com dente: multa, fiscal, processo. Guia prático com os quatro níveis de risco traduzidos pra feature real, NIST AI RMF resumido, checklist técnico de 12 itens e template de AI Decision Record (AIDR) pronto pra colar no repo. Sem teoria de consultoria.

24 Mai · 16 min ›

45 #openai · #ia

Google I/O 2026: 7 anúncios que mudam o trabalho do AI engineer brasileiro

Os sete movimentos de plataforma do Google I/O 2026 que mudam o trabalho do AI engineer brasileiro, com comparativo Gemini 3.5 Flash x Sonnet 4.5 x GPT-5.5 em três tarefas backend reais e o que ignorar do hype enterprise.

23 Mai · 11 min ›

46 #ai-agents · #observabilidade

Quanto custa um agente em produção em 2026: planilha real depois de 6 meses

A calculadora da OpenAI mente. Pricing de token é só um item de linha; a fatura real de um agente em produção tem seis baldes: inferência, eval em runtime, observability, infra, pessoas, outros. Este post abre o balancete de 6 meses, mês a mês, com números e fontes. No fim, build vs buy: quando vale construir e quando você está pagando para reinventar o Cursor.

14 Mai · 15 min ›

47 #performance · #ia

Quando NÃO usar Agentic Code: 8 cenários onde o agente é prejuízo

Curva de hype joga todo mundo no extremo. Aqui está a lista honesta de 8 cenários onde, em 2026, o agente custa mais caro, demora mais e ainda erra mais que o time fazendo na mão, com explicação técnica, benchmarks e dor de produção.

13 Mai · 12 min ›

48 #laravel · #php

TDD com agentes: como escrever testes que sobrevivem ao código gerado

Agente deletou o teste pra fazer passar. Aconteceu, vai acontecer. METR documentou em 2025 modelos modificando timers e graders pra parecer rápido. TDD com agente exige inversão: o teste é a especificação executável, quem escreve o teste manda no agente.

13 Mai · 10 min ›