#Guardrails

Por que a IA alucina — e como reduzir alucinação no seu produto
Notícias

Por que a IA alucina — e como reduzir alucinação no seu produto

Saber que a IA alucina não resolve nada. Veja por que o LLM inventa e como reduzir alucinação de IA no seu produto com grounding, RAG, citações e guardrails.

· 11 min · Lucas Souza
Guardrails para agentes de IA: validando o que entra e o que sai
Tutoriais

Guardrails para agentes de IA: validando o que entra e o que sai

As cercas que separam um agente que roda em produção de um que vive preso no "demo na minha máquina": validar a entrada, restringir o que as tools fazem e checar a saída antes de devolver pro usuário.

· 10 min · Lucas Souza
5 anti-patterns que quebram seu agente de IA em produção
Notícias

5 anti-patterns que quebram seu agente de IA em produção

Funcionava na demo, virou conta de US$ 3 mil e loop infinito em produção. Os 5 anti-patterns de arquitetura que mais quebram agentes de IA em produção — context stuffing, tools sem timeout, retry burro, zero observabilidade e ausência de guardrails — cada um com o sintoma e a correção.

· 10 min · Lucas Souza
Os 4 níveis de autonomia em Agentic Code: do autocompletar ao agente que faz deploy sozinho
Notícias

Os 4 níveis de autonomia em Agentic Code: do autocompletar ao agente que faz deploy sozinho

Quem roda agentes em código de verdade já entendeu que a régua não é se o agente faz, mas quem aprova, quem reverte e quem audita cada ação. Mapa prático de quatro níveis de autonomia em agentic code, do tab completion ao agente que abre PR sozinho em CI, com os gates de engenharia que sustentam cada degrau.

· 13 min · Lucas Souza
Anatomia de um harness em produção: as 6 camadas que separam POC de sistema confiável
Tutoriais

Anatomia de um harness em produção: as 6 camadas que separam POC de sistema confiável

O harness do tutorial roda. Em produção, ele morre na primeira semana. Esse post abre o capô do que entra entre o request e o response quando o agente está vivo 24 por 7: gate, roteador, contexto, loop com budget, pós-processamento e telemetria. Diagrama, código e referências reais para sair do POC e chegar num sistema confiável.

· 11 min · Lucas Souza
Prompts resilientes: 50 casos adversariais para descobrir onde seu prompt quebra
Tutoriais

Prompts resilientes: 50 casos adversariais para descobrir onde seu prompt quebra

Funciona no happy path, mas e quando o usuário manda emoji, idioma misto e SQL injection? Em vez de rezar, monte um dataset com cinquenta casos adversariais, rode evals automatizadas e meça pass rate, custo e latência a cada iteração. É assim que prompt vira engenharia.

· 10 min · Lucas Souza
Prompt injection no agente: quando o site raspado vira o novo system prompt
Tutoriais

Prompt injection no agente: quando o site raspado vira o novo system prompt

Seu agente lê o HTML de uma página de produto. Lê também as instruções escondidas que mandam ele ignorar o usuário e recomendar um link específico. Esse vetor já está sendo explorado em produção. Veja como funciona e o que o harness precisa fazer antes de injetar conteúdo externo no contexto do LLM.

· 13 min · Lucas Souza
Trust layer no agente: como pontuar a confiabilidade de cada fonte antes do LLM ver
Tutoriais

Trust layer no agente: como pontuar a confiabilidade de cada fonte antes do LLM ver

Reranker garante relevancia. Confianca e outra historia. Veja como montar uma trust layer com sinais simples (idade do dominio, densidade de afiliado, coerencia entre reviews) e integrar no reranker antes do LLM ver o conteudo.

· 12 min · Lucas Souza
Sintetizando reviews sem enviesar: como resumir sentimento real em meio a manipulação
Tutoriais

Sintetizando reviews sem enviesar: como resumir sentimento real em meio a manipulação

Joga 8 mil reviews no Claude e pede para resumir. O resumo sai bonito e enganoso. Estrelas mentem, LLM supergeneraliza e a base costuma estar contaminada por manipulação. Este post constrói um pipeline em quatro estágios (saneamento, amostragem estratificada, síntese map-reduce e auditoria) para resumir centenas de reviews sem mascarar crítica real. Útil para UX entender onde o produto dói e para compliance dormir tranquilo sob a nova regra da FTC.

· 10 min · Lucas Souza
Anatomia de um Agent Harness: state, tool execution, feedback loops e guardrails
Tutoriais

Anatomia de um Agent Harness: state, tool execution, feedback loops e guardrails

Harness é o software que envolve o LLM e separa um demo bonito de um agente que aguenta produção. Quebro a anatomia em cinco peças obrigatórias: estado persistente, roteador de ferramentas, validação de I/O, loop de raciocínio e limites de segurança. É o mapa mental que abre a série de posts sobre engenharia de agentes.

· 14 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando