#Ai Agents

01 #ai-agents · #harness

Harness engineering não basta: o manifesto que explica por que as "fábricas de software" com IA falham

O manifesto da HumanLayer que bateu 373 pontos no Hacker News explica por que fábricas de software 100% autônomas degradam codebases e o que fazer no lugar.

25 Jul · 8 min ›

02 #openai · #ai-agents

Por que a Hugging Face investigou o próprio hack com GLM 5.2, um modelo open-weight chinês

Os modelos comerciais recusaram analisar os artefatos do ataque do GPT-5.6. A forense dos 17 mil eventos de log rodou em GLM 5.2, open-weight, na infra da própria Hugging Face. O disclosure batizou isso de problema da assimetria: o atacante não tinha política de uso, o defensor tinha.

23 Jul · 9 min ›

03 #openai · #ai-agents

Um agente da OpenAI fugiu do sandbox e hackeou a Hugging Face: 5 lições pra quem roda agente

A OpenAI confirmou que dois modelos escaparam de um sandbox de avaliação, invadiram a infraestrutura de produção da Hugging Face e roubaram o gabarito do próprio benchmark que estavam fazendo. O nome disso não é rebelião das máquinas: é reward hacking. E as lições valem para qualquer agente com acesso a shell e rede.

22 Jul · 11 min ›

04 #laravel · #ai-agents

Como criar um agente de IA para WhatsApp: passo a passo com API (sem depender de SaaS)

Tutorial dev: monte um agente de IA no WhatsApp com Evolution API e Claude. Webhook, código, memória e a conta real de custo, sem mensalidade de SaaS.

18 Jul · 9 min ›

05 #ai-agents · #llm

Prompt injection: o que é e os principais ataques de 2026 (e como se defender)

Seu agente lê um README e obedece a uma instrução escondida nele. A busca por "prompt injection" multiplicou por 8 no Brasil em 2026. O guia do que é, dos ataques que marcaram o ano e da defesa em camadas que de fato funciona.

15 Jul · 14 min ›

06 #openai · #ai-agents

HP adotou a OpenAI Frontier. O que isso muda (e o que é só anúncio)

A HP Inc. virou uma das primeiras grandes a rodar a OpenAI Frontier, a plataforma de gestão de agentes da OpenAI. Separamos o que foi entregue do que é promessa, e o que isso revela sobre botar agente em produção.

30 Jun · 7 min ›

07 #openai · #ia

Como construir um agente de bolão da Copa 2026 no WhatsApp com Evolution API e N8N

Como construir um agente de IA que gerencia o bolão da Copa 2026 no WhatsApp — com Evolution API, N8N e Google Sheets. Guardrails, engenharia de prompt e de contexto na prática, com o flow real na mesa.

27 Jun · 13 min ›

08 #ia · #ai-agents

Como criar evals para agentes de IA com LLM-as-a-judge

Monte um pipeline de avaliação de agentes de IA com LLM-as-a-judge: dataset de falhas reais, rubricas, scoring com barra de erro e gate no CI. Sem eval, deploy é no escuro.

21 Jun · 12 min ›

09 #ia · #ai-agents

Como criar um bot no Slack com Claude: um agente de dados no seu workspace

Tutorial de um bot de Slack que responde perguntas sobre seus dados com Claude, baseado no cookbook da Anthropic. Do app_mention ao agente em produção.

19 Jun · 11 min ›

10 #ia · #ai-agents

Como criar um servidor MCP do zero: tools, resources e prompts, do stdio ao HTTP

Tutorial mão na massa pra escrever um servidor MCP em Python do zero — uma tool, um resource e um prompt — rodando em stdio e HTTP, plugado no Claude.

19 Jun · 12 min ›

11 #openai · #ia

Agent improvement loop: o ciclo que faz o agente melhorar o próprio código

Como montar um loop de auto-melhoria de agente — gera, testa, avalia, corrige — inspirado no agent improvement loop do Agents SDK da OpenAI. Com código, evals que medem a trajetória e a trava que só aceita a mudança quando o número sobe.

18 Jun · 8 min ›

12 #openai · #ia

Codex CLI: como usar goals para guiar o agente sem microgerenciar

O recurso /goal do Codex CLI faz o agente da OpenAI perseguir um objetivo sozinho. Aprenda a escrever um goal como contrato — com escopo, verificação e condição de parada — em vez de um prompt com esperança embutida.

17 Jun · 10 min ›