#Embeddings

O que é RAG (e onde ele termina e a memória começa)
Notícias

O que é RAG (e onde ele termina e a memória começa)

RAG não é memória, e confundir os dois quebra seu agente. O que é RAG, como funciona por dentro, e onde ele termina e a memória (e o fine-tuning) começam.

· 11 min · Lucas Souza
pgvector no Postgres: onde guardar a memória do seu agente
Tutoriais

pgvector no Postgres: onde guardar a memória do seu agente

Antes de assinar um serviço gerenciado de memória, descubra por que o Postgres que você já tem resolve 80% do problema com pgvector: instalação, uso no Laravel e critérios de decisão.

· 9 min · Lucas Souza
Reranker: o passo que faz seu RAG parar de devolver lixo
Tutoriais

Reranker: o passo que faz seu RAG parar de devolver lixo

A busca vetorial traz 20 candidatos "parecidos" — mas parecido não é relevante. O reranker reordena por relevância real antes de mandar pro modelo. Este post mostra cross-encoder vs busca híbrida e quando cada um vale, com código rodando.

· 9 min · Lucas Souza
RAG do zero: chunking, embeddings e busca que funciona
Tutoriais

RAG do zero: chunking, embeddings e busca que funciona

RAG não é mágica: é quebrar texto, virar vetor e buscar bem. O passo a passo de um RAG do zero — chunking recursive com overlap, embeddings com text-embedding-3-small e busca por similaridade no Postgres com pgvector e índice HNSW. Errar o chunking é onde 80% dos RAGs nascem ruins.

· 10 min · Lucas Souza
RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo
Notícias

RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo

A briga "RAG ou fine-tuning?" acabou em 2026. 60% dos projetos sérios rodam os dois — fine-tuning controla COMO o modelo responde (formato, tom, raciocínio), RAG controla O QUÊ (fatos atuais e citáveis). Veja o benchmark 96% híbrido vs 89% RAG só vs 91% fine-tuning só, o padrão de roteamento por classificador leve que corta 70–90% do custo, e os cenários em que combinar os dois é overengineering.

· 5 min · Lucas Souza
Laravel AI SDK chegou: vale migrar do Prism (ou do seu wrapper)?
Notícias

Laravel AI SDK chegou: vale migrar do Prism (ou do seu wrapper)?

Laravel AI SDK saiu em fevereiro/2026 e ficou estável em março, junto com o Laravel 13. Portei um projeto real de Prism pra SDK oficial: 47 linhas a menos, switch de provider em uma atribuição, embeddings e vector store first-party. O diff aberto, o que continua valendo no Prism e quando não migrar.

· 2 min · Lucas Souza
Guia de RAG para devs backend: do zero ao pgvector em Laravel
Tutoriais

Guia de RAG para devs backend: do zero ao pgvector em Laravel

Tutorial completo de RAG em Laravel com PostgreSQL e pgvector: ingestion assíncrono, busca híbrida BM25 + embeddings com RRF, tool use no Claude API e as três métricas que separam protótipo de produto (recall@5, faithfulness e latência p95).

· 10 min · Lucas Souza
RAG não é só vector search: combinando busca semântica, SQL e tools no mesmo agente
Tutoriais

RAG não é só vector search: combinando busca semântica, SQL e tools no mesmo agente

Vector-only, hybrid (BM25 + vetor + RRF) e o stack completo com SQL e reranker como tools separadas: comparação prática com benchmarks reais e código de produção.

· 11 min · Lucas Souza
Agente que pesquisa antes de agir: multi-tool + RAG em Laravel com pgvector
Tutoriais

Agente que pesquisa antes de agir: multi-tool + RAG em Laravel com pgvector

Como construir um agente em Laravel que decide quando buscar e quando responder direto. Arquitetura completa com Prism PHP, pgvector e a lógica de orquestração que separa demo de produto.

· 7 min · Lucas Souza
Memória de agente: por que seu assistente de compras esquece o usuário (e como consertar)
Tutoriais

Memória de agente: por que seu assistente de compras esquece o usuário (e como consertar)

Sem memória persistente, todo turno do seu assistente de compras começa do zero. Veja como combinar contexto, sumário e memória vetorizada por usuário para parar de esquecer preço de referência, marca rejeitada e faixa de orçamento.

· 12 min · Lucas Souza
Do prompt ao carrinho: arquitetura de um agente que compara ofertas entre Amazon, Mercado Livre e Magalu
Tutoriais

Do prompt ao carrinho: arquitetura de um agente que compara ofertas entre Amazon, Mercado Livre e Magalu

O agente que compara preços entre Amazon, Mercado Livre e Magalu funciona uma vez na frente da câmera. Em produção quebra em três pontos que a demo nunca mostra: produto que não é o mesmo, frete e cupom ignorados, e API que vai morrer em abril. Este post abre a arquitetura em cinco camadas e mostra as decisões que separam demo de feature real.

· 12 min · Lucas Souza
Cross-encoder reranker: o componente que mais eleva qualidade do seu agente por dólar
Tutoriais

Cross-encoder reranker: o componente que mais eleva qualidade do seu agente por dólar

Retrieval traz 100 candidatos, reranker escolhe os 10 certos. Entenda o trade-off latência x precisão, quando rerankar 50 vs. 200 documentos e por que cross-encoder é o investimento de melhor ROI antes de trocar para um LLM mais caro.

· 10 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando