Tutoriais

Tutoriais

Guias práticos passo a passo sobre Laravel, Filament e ecossistema PHP.

Agentic RAG: quando seu RAG precisa virar agente
Tutoriais

Agentic RAG: quando seu RAG precisa virar agente

RAG tradicional busca uma vez e reza. Agentic RAG decide quando buscar, o que buscar e quando parar. Veja a diferença real, com números de paper, e monte o loop de decisão sem explodir o custo.

· 9 min · Lucas Souza
Claude -p vai morrer: como migrar para o Claude Agent SDK
Tutoriais

Claude -p vai morrer: como migrar para o Claude Agent SDK

O modo headless claude -p está sendo substituído pelo Claude Agent SDK. Guia prático de migração: o que muda no uso com seu plano Claude e como rodar agentes headless do jeito novo.

· 11 min · Lucas Souza
Reduzir custo de API de IA: os vazamentos de token mais comuns
Tutoriais

Reduzir custo de API de IA: os vazamentos de token mais comuns

Sua conta de API de IA veio 4x maior do que o previsto? Antes de cortar feature, vamos achar os cinco vazamentos de token mais comuns em produção e o conserto de cada um.

· 10 min · Lucas Souza
Prompt para gerar código: 8 padrões que tiram o ar de tutorial genérico da IA
Tutoriais

Prompt para gerar código: 8 padrões que tiram o ar de tutorial genérico da IA

A IA gera código que funciona, mas parece copiado de um tutorial de 2021. Oito padrões de prompt para gerar código que segue o padrão do SEU projeto, não o exemplo genérico. Direto das docs da Anthropic e do Claude Code.

· 11 min · Lucas Souza
Por que o agente esquece tudo: como dar memória de verdade ao seu agente de IA
Tutoriais

Por que o agente esquece tudo: como dar memória de verdade ao seu agente de IA

Seu agente de IA começa do zero a cada sessão porque o modelo é stateless. Entenda por que ele esquece, a diferença entre memória de curto e longo prazo, e como dar memória de verdade sem complexidade desnecessária.

· 11 min · Lucas Souza
Estourou o limite de tokens do ChatGPT: por que a IA esquece e como resolver
Tutoriais

Estourou o limite de tokens do ChatGPT: por que a IA esquece e como resolver

A IA não esquece por burrice. É a janela de contexto. Entenda pela dor o limite de tokens e as quatro saídas: resumo, RAG, chunking e memória.

· 10 min · Lucas Souza
Tool calling não funciona? Por que seu agente chama a ferramenta errada (e como consertar)
Tutoriais

Tool calling não funciona? Por que seu agente chama a ferramenta errada (e como consertar)

O agente tinha a ferramenta certa na mão e escolheu a errada. O problema quase sempre está na descrição, no schema e no nome que você definiu, não no modelo. Veja como consertar com código e os números da Anthropic.

· 11 min · Lucas Souza
Seu RAG não funciona? As causas reais (e o conserto de cada uma)
Tutoriais

Seu RAG não funciona? As causas reais (e o conserto de cada uma)

Seu RAG responde tudo menos o que está nos documentos? O problema quase nunca é o LLM. É uma das quatro etapas antes dele. Diagnóstico das causas reais (chunking, embedding, falta de reranker e prompt) com o conserto de cada uma.

· 12 min · Lucas Souza
Por que seu agente de IA entra em loop infinito (e como pôr um freio)
Tutoriais

Por que seu agente de IA entra em loop infinito (e como pôr um freio)

Seu agente repete a mesma ação pra sempre e queima tokens. As três causas — sem critério de parada, tool result mal formatado, prompt ambíguo — e os freios práticos pra cortar isso em produção.

· 11 min · Lucas Souza
O que é embedding — e por que sua busca semântica devolve resultado errado
Tutoriais

O que é embedding — e por que sua busca semântica devolve resultado errado

Busca semântica devolvendo resultado sem nexo? O problema quase nunca é o banco vetorial — é o embedding. Entenda o que é embedding e conserte os 3 pontos onde a busca por similaridade quebra: modelo, normalização e chunking.

· 8 min · Lucas Souza
Como criar um agente de IA do zero (com código, não no-code)
Tutoriais

Como criar um agente de IA do zero (com código, não no-code)

Os tutoriais que dominam o Google te ensinam a clicar em "Criar agente". Aqui você escreve o seu, em Python puro: loop de raciocínio, tool calling e memória, as três peças que toda plataforma no-code esconde.

· 11 min · Lucas Souza
Avaliação de agentes de IA: como montar evals honestos
Tutoriais

Avaliação de agentes de IA: como montar evals honestos

"Funciona nos meus testes" não é avaliação. Como montar evals honestos para um agente: golden set de falhas reais, métricas por etapa (recuperação, decisão de tool, resposta) e LLM como juiz com cautela.

· 10 min · Lucas Souza

Curte cerveja e código? 🍺 Pergunta pra VirguIA como entrar no clã Beer and Code.

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando