#Harness

01 #ai-agents · #harness

Harness engineering não basta: o manifesto que explica por que as "fábricas de software" com IA falham

O manifesto da HumanLayer que bateu 373 pontos no Hacker News explica por que fábricas de software 100% autônomas degradam codebases e o que fazer no lugar.

25 Jul · 8 min ›

02 #openai · #ai-agents

HP adotou a OpenAI Frontier. O que isso muda (e o que é só anúncio)

A HP Inc. virou uma das primeiras grandes a rodar a OpenAI Frontier, a plataforma de gestão de agentes da OpenAI. Separamos o que foi entregue do que é promessa, e o que isso revela sobre botar agente em produção.

30 Jun · 7 min ›

03 #ia · #agentes

O que é Harness de IA? O ambiente que faz seu agente parar de travar

O harness é o ambiente que roda o agente — loop, ferramentas, estado e guardrails. É ele, não o modelo, que decide se seu agente aguenta produção ou trava na primeira tarefa de verdade.

15 Jun · 8 min ›

04 #agentes · #ai-agents

Por que seu agente de IA entra em loop infinito (e como pôr um freio)

Seu agente repete a mesma ação pra sempre e queima tokens. As três causas — sem critério de parada, tool result mal formatado, prompt ambíguo — e os freios práticos pra cortar isso em produção.

11 Jun · 11 min ›

05 #ia · #rag

Context engineering: a skill nº1 do AI engineer em 2026

Em 2026 a vaga sênior não pede mais prompt engineer. Pede pipeline de contexto. Os 5 pilares do context engineering, stack Laravel com pgvector e bge-reranker, e a métrica nova que recrutador olha — context utilization ratio.

30 Mai · 11 min ›

06 #performance · #ai-agents

Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente

Agente nosso queimava US$ 2.300/mês rodando Claude Opus em loop. Trocamos por Plan-and-Execute: uma chamada cara que planeja, N chamadas baratas que executam. Conta nova: US$ 220/mês com a mesma qualidade. Planilha de tokens, código Laravel (PlanJob + ExecuteStep) e o tipo de fluxo onde esse pattern quebra.

29 Mai · 10 min ›

07 #ia · #ai-agents

MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente

MCP local não é MCP em produção. Sair do stdio no laptop pra um servidor MCP servindo agente corporativo exige três mudanças: Streamable HTTP no transporte, OAuth 2.1 com PKCE e Resource Indicators na auth, e JSON Schema 2020-12 estrito nos argumentos. E um gateway corporativo no meio, sempre.

29 Mai · 17 min ›

08 #openai · #ia

RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo

A briga "RAG ou fine-tuning?" acabou em 2026. 60% dos projetos sérios rodam os dois — fine-tuning controla COMO o modelo responde (formato, tom, raciocínio), RAG controla O QUÊ (fatos atuais e citáveis). Veja o benchmark 96% híbrido vs 89% RAG só vs 91% fine-tuning só, o padrão de roteamento por classificador leve que corta 70–90% do custo, e os cenários em que combinar os dois é overengineering.

29 Mai · 5 min ›

09 #laravel · #agentes

Multi-agent em Laravel: 3 padrões testados em produção (Orchestrator, Hierarchical, Swarm)

Três arquiteturas multi-agent que sobreviveram a um projeto Laravel em produção: Orchestrator-Worker, Hierarchical e Swarm. Tem código real (Prism PHP, PrismAgents, Bus::batch, State Machine), o anti-padrão dos "4 prompts em paralelo" e o custo medido (hierarchical 30% mais barato).

28 Mai · 12 min ›

10 #ai-agents · #observabilidade

Observabilidade de agentes de IA: LangSmith vs Langfuse vs Helicone (e o que cada um NÃO faz)

Mapa frio das três opções de LLM observability em maio de 2026 (uma delas em maintenance mode), com setup Langfuse self-hosted em Laravel e três métricas de agente que mudam o jogo.

28 Mai · 12 min ›

11 #openai · #ia

Glossário do AI Engineer Vol.2: 20 termos NOVOS que apareceram em 2026 (que você não pode chegar sem saber)

Em seis meses depois do Vol.1, vinte termos novos entraram no vocabulário dos times sérios de IA: context engineering, plan-and-execute, streamable HTTP MCP, AIDR, harness telemetry, world models, spec-driven dev. Cada um em duas ou três linhas, com exemplo concreto. Bônus: cinco que sumiram.

26 Mai · 14 min ›

12 #ia · #rag

30 perguntas de entrevista para AI engineer (e como eu respondo cada uma)

30 perguntas reais (10 técnicas, 10 de arquitetura, 10 comportamentais) de entrevistas para AI engineer em maio de 2026. Pra cada uma: resposta curta de 30s, resposta de senior de 2min, e o red flag que entrega o junior. Mais 5 perguntas reversas pra filtrar empresa sem maturidade de IA.

25 Mai · 14 min ›