Tutoriais

Agentic RAG: quando seu RAG precisa virar agente

RAG tradicional busca uma vez e reza. Agentic RAG decide quando buscar, o que buscar e quando parar. Veja a diferença real, com números de paper, e monte o loop de decisão sem explodir o custo.

16 Jun 2026 · 9 min · Lucas Souza

Tutoriais

Claude -p vai morrer: como migrar para o Claude Agent SDK

O modo headless claude -p está sendo substituído pelo Claude Agent SDK. Guia prático de migração: o que muda no uso com seu plano Claude e como rodar agentes headless do jeito novo.

15 Jun 2026 · 11 min · Lucas Souza

Tutoriais

Reduzir custo de API de IA: os vazamentos de token mais comuns

Sua conta de API de IA veio 4x maior do que o previsto? Antes de cortar feature, vamos achar os cinco vazamentos de token mais comuns em produção e o conserto de cada um.

14 Jun 2026 · 10 min · Lucas Souza

Tutoriais

Prompt para gerar código: 8 padrões que tiram o ar de tutorial genérico da IA

A IA gera código que funciona, mas parece copiado de um tutorial de 2021. Oito padrões de prompt para gerar código que segue o padrão do SEU projeto, não o exemplo genérico. Direto das docs da Anthropic e do Claude Code.

13 Jun 2026 · 11 min · Lucas Souza

Tutoriais

Por que o agente esquece tudo: como dar memória de verdade ao seu agente de IA

Seu agente de IA começa do zero a cada sessão porque o modelo é stateless. Entenda por que ele esquece, a diferença entre memória de curto e longo prazo, e como dar memória de verdade sem complexidade desnecessária.

13 Jun 2026 · 11 min · Lucas Souza

Tutoriais

Estourou o limite de tokens do ChatGPT: por que a IA esquece e como resolver

A IA não esquece por burrice. É a janela de contexto. Entenda pela dor o limite de tokens e as quatro saídas: resumo, RAG, chunking e memória.

13 Jun 2026 · 10 min · Lucas Souza

Tutoriais

Tool calling não funciona? Por que seu agente chama a ferramenta errada (e como consertar)

O agente tinha a ferramenta certa na mão e escolheu a errada. O problema quase sempre está na descrição, no schema e no nome que você definiu, não no modelo. Veja como consertar com código e os números da Anthropic.

12 Jun 2026 · 11 min · Lucas Souza

Tutoriais

Seu RAG não funciona? As causas reais (e o conserto de cada uma)

Seu RAG responde tudo menos o que está nos documentos? O problema quase nunca é o LLM. É uma das quatro etapas antes dele. Diagnóstico das causas reais (chunking, embedding, falta de reranker e prompt) com o conserto de cada uma.

11 Jun 2026 · 12 min · Lucas Souza

Tutoriais

Por que seu agente de IA entra em loop infinito (e como pôr um freio)

Seu agente repete a mesma ação pra sempre e queima tokens. As três causas — sem critério de parada, tool result mal formatado, prompt ambíguo — e os freios práticos pra cortar isso em produção.

11 Jun 2026 · 11 min · Lucas Souza

Tutoriais

O que é embedding — e por que sua busca semântica devolve resultado errado

Busca semântica devolvendo resultado sem nexo? O problema quase nunca é o banco vetorial — é o embedding. Entenda o que é embedding e conserte os 3 pontos onde a busca por similaridade quebra: modelo, normalização e chunking.

10 Jun 2026 · 8 min · Lucas Souza

Tutoriais

Como criar um agente de IA do zero (com código, não no-code)

Os tutoriais que dominam o Google te ensinam a clicar em "Criar agente". Aqui você escreve o seu, em Python puro: loop de raciocínio, tool calling e memória, as três peças que toda plataforma no-code esconde.

09 Jun 2026 · 11 min · Lucas Souza

Tutoriais

Avaliação de agentes de IA: como montar evals honestos

"Funciona nos meus testes" não é avaliação. Como montar evals honestos para um agente: golden set de falhas reais, métricas por etapa (recuperação, decisão de tool, resposta) e LLM como juiz com cautela.

06 Jun 2026 · 10 min · Lucas Souza