#Rag

Notícias

Por que a IA alucina — e como reduzir alucinação no seu produto

Saber que a IA alucina não resolve nada. Veja por que o LLM inventa e como reduzir alucinação de IA no seu produto com grounding, RAG, citações e guardrails.

· 11 min · Lucas Souza
O que é RAG (e onde ele termina e a memória começa)
Notícias

O que é RAG (e onde ele termina e a memória começa)

RAG não é memória, e confundir os dois quebra seu agente. O que é RAG, como funciona por dentro, e onde ele termina e a memória (e o fine-tuning) começam.

· 11 min · Lucas Souza
Agentic RAG: quando o agente decide o que buscar
Tutoriais

Agentic RAG: quando o agente decide o que buscar

No RAG clássico a busca acontece sempre. No agentic RAG o agente decide se busca, o que busca e quantas vezes, tratando a recuperação como uma tool. Veja o padrão de código e, principalmente, quando esse poder vale o custo.

· 9 min · Lucas Souza
pgvector no Postgres: onde guardar a memória do seu agente
Tutoriais

pgvector no Postgres: onde guardar a memória do seu agente

Antes de assinar um serviço gerenciado de memória, descubra por que o Postgres que você já tem resolve 80% do problema com pgvector: instalação, uso no Laravel e critérios de decisão.

· 9 min · Lucas Souza
Reranker: o passo que faz seu RAG parar de devolver lixo
Tutoriais

Reranker: o passo que faz seu RAG parar de devolver lixo

A busca vetorial traz 20 candidatos "parecidos" — mas parecido não é relevante. O reranker reordena por relevância real antes de mandar pro modelo. Este post mostra cross-encoder vs busca híbrida e quando cada um vale, com código rodando.

· 9 min · Lucas Souza
RAG do zero: chunking, embeddings e busca que funciona
Tutoriais

RAG do zero: chunking, embeddings e busca que funciona

RAG não é mágica: é quebrar texto, virar vetor e buscar bem. O passo a passo de um RAG do zero — chunking recursive com overlap, embeddings com text-embedding-3-small e busca por similaridade no Postgres com pgvector e índice HNSW. Errar o chunking é onde 80% dos RAGs nascem ruins.

· 10 min · Lucas Souza
Quando usar RAG (e quando fine-tuning ou contexto resolvem melhor)
Notícias

Quando usar RAG (e quando fine-tuning ou contexto resolvem melhor)

RAG virou resposta automática pra tudo, e quase sempre é a escolha errada. O mapa de decisão entre RAG, fine-tuning e contexto pelos critérios que importam: volatilidade do dado, custo, rastreabilidade e tamanho.

· 11 min · Lucas Souza
Context engineering: a skill nº1 do AI engineer em 2026
Tutoriais

Context engineering: a skill nº1 do AI engineer em 2026

Em 2026 a vaga sênior não pede mais prompt engineer. Pede pipeline de contexto. Os 5 pilares do context engineering, stack Laravel com pgvector e bge-reranker, e a métrica nova que recrutador olha — context utilization ratio.

· 10 min · Lucas Souza
RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo
Notícias

RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo

A briga "RAG ou fine-tuning?" acabou em 2026. 60% dos projetos sérios rodam os dois — fine-tuning controla COMO o modelo responde (formato, tom, raciocínio), RAG controla O QUÊ (fatos atuais e citáveis). Veja o benchmark 96% híbrido vs 89% RAG só vs 91% fine-tuning só, o padrão de roteamento por classificador leve que corta 70–90% do custo, e os cenários em que combinar os dois é overengineering.

· 5 min · Lucas Souza
30 perguntas de entrevista para AI engineer (e como eu respondo cada uma)
Tutoriais

30 perguntas de entrevista para AI engineer (e como eu respondo cada uma)

30 perguntas reais (10 técnicas, 10 de arquitetura, 10 comportamentais) de entrevistas para AI engineer em maio de 2026. Pra cada uma: resposta curta de 30s, resposta de senior de 2min, e o red flag que entrega o junior. Mais 5 perguntas reversas pra filtrar empresa sem maturidade de IA.

· 14 min · Lucas Souza
Guia de RAG para devs backend: do zero ao pgvector em Laravel
Tutoriais

Guia de RAG para devs backend: do zero ao pgvector em Laravel

Tutorial completo de RAG em Laravel com PostgreSQL e pgvector: ingestion assíncrono, busca híbrida BM25 + embeddings com RRF, tool use no Claude API e as três métricas que separam protótipo de produto (recall@5, faithfulness e latência p95).

· 10 min · Lucas Souza
Portfólio de AI Engineer: 5 projetos que abrem porta sem precisar de mestrado
Tutoriais

Portfólio de AI Engineer: 5 projetos que abrem porta sem precisar de mestrado

Recrutador olha 11 segundos. Notebook de fine-tuning de Llama no Colab não convence ninguém. Cinco projetos pequenos que provam skill real de AI engineer e cabem em 1 a 3 fins de semana cada.

· 13 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando