#Ai Agents
Claude Fable 5: 10 coisas que o Opus 4.8 não fazia bem
A Anthropic liberou o Claude Fable 5, primeiro modelo da classe Mythos para uso geral. Veja 10 tarefas reais que ele resolve e que o Opus 4.8 fazia mal ou não fazia.
Como criar um agente de IA do zero (com código, não no-code)
Os tutoriais que dominam o Google te ensinam a clicar em "Criar agente". Aqui você escreve o seu, em Python puro: loop de raciocínio, tool calling e memória, as três peças que toda plataforma no-code esconde.
Arquitetura de agentes de IA: o blueprint de ponta a ponta
A semana inteira em um diagrama só — as seis camadas de uma arquitetura de agentes de IA (modelo, contexto, tools/MCP, RAG, guardrails, observabilidade), como se encaixam e um checklist de produção pra defender o agente numa code review.
Avaliação de agentes de IA: como montar evals honestos
"Funciona nos meus testes" não é avaliação. Como montar evals honestos para um agente: golden set de falhas reais, métricas por etapa (recuperação, decisão de tool, resposta) e LLM como juiz com cautela.
Guardrails para agentes de IA: validando o que entra e o que sai
As cercas que separam um agente que roda em produção de um que vive preso no "demo na minha máquina": validar a entrada, restringir o que as tools fazem e checar a saída antes de devolver pro usuário.
5 anti-patterns que quebram seu agente de IA em produção
Funcionava na demo, virou conta de US$ 3 mil e loop infinito em produção. Os 5 anti-patterns de arquitetura que mais quebram agentes de IA em produção — context stuffing, tools sem timeout, retry burro, zero observabilidade e ausência de guardrails — cada um com o sintoma e a correção.
Agentic RAG: quando o agente decide o que buscar
No RAG clássico a busca acontece sempre. No agentic RAG o agente decide se busca, o que busca e quantas vezes, tratando a recuperação como uma tool. Veja o padrão de código e, principalmente, quando esse poder vale o custo.
Montando um agente mínimo viável com Claude API + Laravel
Um walkthrough de um agente funcional em PHP puro com Laravel, batendo direto na Claude API, sem framework de agente nenhum. Só o loop prompt, tool use e resposta.
System prompt de produção: a espinha dorsal do comportamento do agente
O system prompt não é onde você manda o modelo ser legal. É a constituição do agente: papel, políticas, ferramentas e formato. Como estruturar um de produção e por que ele joga num campeonato diferente de um prompt de chat.
Progressive disclosure: como não afogar seu agente em 50 ferramentas
Colocar 50 ferramentas no contexto do agente degrada a escolha e estoura tokens. Progressive disclosure carrega tools sob demanda: o agente descobre o que precisa quando precisa. Padrão central de arquitetura de agentes que escalam.
Programmatic tool calling: deixe o agente escrever o código em vez de chamar tool a tool
Chamar 12 tools uma a uma é caro, lento e entope o contexto. Programmatic tool calling vira o jogo: o agente escreve um código que orquestra as chamadas e devolve só a resposta. Entenda o padrão com exemplos da Claude API e do Code Mode da Cloudflare.
Como criar seu primeiro MCP server (tool + resource) e plugar no Claude
Tutorial em PT-BR pra escrever um MCP server do zero em Python: uma tool que consulta CEP e um resource que expoe os padroes do time. No fim, voce pluga no Claude e ve o agente chamar uma ferramenta que voce mesmo escreveu.