#Embeddings

01 #ia · #embeddings

O que é um banco de dados vetorial? Guia prático com exemplo (pgvector)

Banco de dados vetorial explicado de baixo pra cima: o que é, como a busca por similaridade funciona por dentro e como montar um com pgvector no Postgres que você já tem.

23 Jul · 10 min ›

02 #ia · #embeddings

RAG híbrido na prática: BM25, embeddings e reranker

Embedding sozinho erra mais do que você imagina. Veja como combinar busca lexical (BM25), busca semântica e um reranker cross-encoder para subir a qualidade do RAG em produção, com código em Python e LangChain.

21 Jun · 9 min ›

03 #ia · #embeddings

Agentic RAG: quando seu RAG precisa virar agente

RAG tradicional busca uma vez e reza. Agentic RAG decide quando buscar, o que buscar e quando parar. Veja a diferença real, com números de paper, e monte o loop de decisão sem explodir o custo.

16 Jun · 9 min ›

04 #embeddings · #rag

Seu RAG não funciona? As causas reais (e o conserto de cada uma)

Seu RAG responde tudo menos o que está nos documentos? O problema quase nunca é o LLM. É uma das quatro etapas antes dele. Diagnóstico das causas reais (chunking, embedding, falta de reranker e prompt) com o conserto de cada uma.

11 Jun · 12 min ›

05 #embeddings · #pgvector

O que é embedding — e por que sua busca semântica devolve resultado errado

Busca semântica devolvendo resultado sem nexo? O problema quase nunca é o banco vetorial — é o embedding. Entenda o que é embedding e conserte os 3 pontos onde a busca por similaridade quebra: modelo, normalização e chunking.

10 Jun · 8 min ›

06 #ia · #agentes

O que é RAG (e onde ele termina e a memória começa)

RAG não é memória, e confundir os dois quebra seu agente. O que é RAG, como funciona por dentro, e onde ele termina e a memória (e o fine-tuning) começam.

07 Jun · 11 min ›

07 #laravel · #php

pgvector no Postgres: onde guardar a memória do seu agente

Antes de assinar um serviço gerenciado de memória, descubra por que o Postgres que você já tem resolve 80% do problema com pgvector: instalação, uso no Laravel e critérios de decisão.

05 Jun · 9 min ›

08 #ia · #embeddings

Reranker: o passo que faz seu RAG parar de devolver lixo

A busca vetorial traz 20 candidatos "parecidos" — mas parecido não é relevante. O reranker reordena por relevância real antes de mandar pro modelo. Este post mostra cross-encoder vs busca híbrida e quando cada um vale, com código rodando.

04 Jun · 9 min ›

09 #ia · #embeddings

RAG do zero: chunking, embeddings e busca que funciona

RAG não é mágica: é quebrar texto, virar vetor e buscar bem. O passo a passo de um RAG do zero — chunking recursive com overlap, embeddings com text-embedding-3-small e busca por similaridade no Postgres com pgvector e índice HNSW. Errar o chunking é onde 80% dos RAGs nascem ruins.

04 Jun · 10 min ›

10 #openai · #ia

RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo

A briga "RAG ou fine-tuning?" acabou em 2026. 60% dos projetos sérios rodam os dois — fine-tuning controla COMO o modelo responde (formato, tom, raciocínio), RAG controla O QUÊ (fatos atuais e citáveis). Veja o benchmark 96% híbrido vs 89% RAG só vs 91% fine-tuning só, o padrão de roteamento por classificador leve que corta 70–90% do custo, e os cenários em que combinar os dois é overengineering.

29 Mai · 5 min ›

11 #laravel · #eloquent

Laravel AI SDK chegou: vale migrar do Prism (ou do seu wrapper)?

Laravel AI SDK saiu em fevereiro/2026 e ficou estável em março, junto com o Laravel 13. Portei um projeto real de Prism pra SDK oficial: 47 linhas a menos, switch de provider em uma atribuição, embeddings e vector store first-party. O diff aberto, o que continua valendo no Prism e quando não migrar.

25 Mai · 2 min ›

12 #laravel · #php

Guia de RAG para devs backend: do zero ao pgvector em Laravel

Tutorial completo de RAG em Laravel com PostgreSQL e pgvector: ingestion assíncrono, busca híbrida BM25 + embeddings com RRF, tool use no Claude API e as três métricas que separam protótipo de produto (recall@5, faithfulness e latência p95).

23 Mai · 10 min ›