#Rag — Blog Beer And Code

01 #ia · #embeddings

O que é um banco de dados vetorial? Guia prático com exemplo (pgvector)

Banco de dados vetorial explicado de baixo pra cima: o que é, como a busca por similaridade funciona por dentro e como montar um com pgvector no Postgres que você já tem.

23 Jul · 10 min ›

02 #ia · #rag

O que é fine tuning? Guia prático (e quando NÃO usar)

Todo mundo acha que precisa de fine tuning. Quase ninguém precisa. O guia direto do que é, como funciona e o critério honesto de quando usar vs RAG vs contexto.

21 Jul · 10 min ›

03 #ia · #embeddings

RAG híbrido na prática: BM25, embeddings e reranker

Embedding sozinho erra mais do que você imagina. Veja como combinar busca lexical (BM25), busca semântica e um reranker cross-encoder para subir a qualidade do RAG em produção, com código em Python e LangChain.

21 Jun · 9 min ›

04 #ia · #embeddings

Agentic RAG: quando seu RAG precisa virar agente

RAG tradicional busca uma vez e reza. Agentic RAG decide quando buscar, o que buscar e quando parar. Veja a diferença real, com números de paper, e monte o loop de decisão sem explodir o custo.

16 Jun · 9 min ›

05 #agentes · #pgvector

Por que o agente esquece tudo: como dar memória de verdade ao seu agente de IA

Seu agente de IA começa do zero a cada sessão porque o modelo é stateless. Entenda por que ele esquece, a diferença entre memória de curto e longo prazo, e como dar memória de verdade sem complexidade desnecessária.

13 Jun · 11 min ›

06 #rag · #llm

Estourou o limite de tokens do ChatGPT: por que a IA esquece e como resolver

A IA não esquece por burrice. É a janela de contexto. Entenda pela dor o limite de tokens e as quatro saídas: resumo, RAG, chunking e memória.

13 Jun · 10 min ›

07 #embeddings · #rag

Seu RAG não funciona? As causas reais (e o conserto de cada uma)

Seu RAG responde tudo menos o que está nos documentos? O problema quase nunca é o LLM. É uma das quatro etapas antes dele. Diagnóstico das causas reais (chunking, embedding, falta de reranker e prompt) com o conserto de cada uma.

11 Jun · 12 min ›

08 #embeddings · #pgvector

O que é embedding — e por que sua busca semântica devolve resultado errado

Busca semântica devolvendo resultado sem nexo? O problema quase nunca é o banco vetorial — é o embedding. Entenda o que é embedding e conserte os 3 pontos onde a busca por similaridade quebra: modelo, normalização e chunking.

10 Jun · 8 min ›

09 #rag · #alucinacao

Por que a IA alucina — e como reduzir alucinação no seu produto

Saber que a IA alucina não resolve nada. Veja por que o LLM inventa e como reduzir alucinação de IA no seu produto com grounding, RAG, citações e guardrails.

09 Jun · 11 min ›

10 #ia · #agentes

O que é RAG (e onde ele termina e a memória começa)

RAG não é memória, e confundir os dois quebra seu agente. O que é RAG, como funciona por dentro, e onde ele termina e a memória (e o fine-tuning) começam.

07 Jun · 11 min ›

11 #ia · #agentes

Agentic RAG: quando o agente decide o que buscar

No RAG clássico a busca acontece sempre. No agentic RAG o agente decide se busca, o que busca e quantas vezes, tratando a recuperação como uma tool. Veja o padrão de código e, principalmente, quando esse poder vale o custo.

05 Jun · 9 min ›

12 #laravel · #php

pgvector no Postgres: onde guardar a memória do seu agente

Antes de assinar um serviço gerenciado de memória, descubra por que o Postgres que você já tem resolve 80% do problema com pgvector: instalação, uso no Laravel e critérios de decisão.

05 Jun · 9 min ›