#Ia

Notícias

Claude Fable 5: 10 coisas que o Opus 4.8 não fazia bem

A Anthropic liberou o Claude Fable 5, primeiro modelo da classe Mythos para uso geral. Veja 10 tarefas reais que ele resolve e que o Opus 4.8 fazia mal ou não fazia.

· 9 min · Lucas Souza
Vibe coding: o que é, por que todo dev fala disso e onde ele quebra
Notícias

Vibe coding: o que é, por que todo dev fala disso e onde ele quebra

Vibe coding — construir software conversando com a IA sem revisar o código — é o termo do momento. Veja o que é de verdade, onde acelera e onde vira dívida técnica silenciosa.

· 8 min · Lucas Souza
Arquitetura de agentes de IA: o blueprint de ponta a ponta
Notícias

Arquitetura de agentes de IA: o blueprint de ponta a ponta

A semana inteira em um diagrama só — as seis camadas de uma arquitetura de agentes de IA (modelo, contexto, tools/MCP, RAG, guardrails, observabilidade), como se encaixam e um checklist de produção pra defender o agente numa code review.

· 14 min · Lucas Souza
O que é RAG (e onde ele termina e a memória começa)
Notícias

O que é RAG (e onde ele termina e a memória começa)

RAG não é memória, e confundir os dois quebra seu agente. O que é RAG, como funciona por dentro, e onde ele termina e a memória (e o fine-tuning) começam.

· 11 min · Lucas Souza
Avaliação de agentes de IA: como montar evals honestos
Tutoriais

Avaliação de agentes de IA: como montar evals honestos

"Funciona nos meus testes" não é avaliação. Como montar evals honestos para um agente: golden set de falhas reais, métricas por etapa (recuperação, decisão de tool, resposta) e LLM como juiz com cautela.

· 10 min · Lucas Souza
Guardrails para agentes de IA: validando o que entra e o que sai
Tutoriais

Guardrails para agentes de IA: validando o que entra e o que sai

As cercas que separam um agente que roda em produção de um que vive preso no "demo na minha máquina": validar a entrada, restringir o que as tools fazem e checar a saída antes de devolver pro usuário.

· 10 min · Lucas Souza
5 anti-patterns que quebram seu agente de IA em produção
Notícias

5 anti-patterns que quebram seu agente de IA em produção

Funcionava na demo, virou conta de US$ 3 mil e loop infinito em produção. Os 5 anti-patterns de arquitetura que mais quebram agentes de IA em produção — context stuffing, tools sem timeout, retry burro, zero observabilidade e ausência de guardrails — cada um com o sintoma e a correção.

· 10 min · Lucas Souza
Agentic RAG: quando o agente decide o que buscar
Tutoriais

Agentic RAG: quando o agente decide o que buscar

No RAG clássico a busca acontece sempre. No agentic RAG o agente decide se busca, o que busca e quantas vezes, tratando a recuperação como uma tool. Veja o padrão de código e, principalmente, quando esse poder vale o custo.

· 9 min · Lucas Souza
pgvector no Postgres: onde guardar a memória do seu agente
Tutoriais

pgvector no Postgres: onde guardar a memória do seu agente

Antes de assinar um serviço gerenciado de memória, descubra por que o Postgres que você já tem resolve 80% do problema com pgvector: instalação, uso no Laravel e critérios de decisão.

· 9 min · Lucas Souza
Montando um agente mínimo viável com Claude API + Laravel
Tutoriais

Montando um agente mínimo viável com Claude API + Laravel

Um walkthrough de um agente funcional em PHP puro com Laravel, batendo direto na Claude API, sem framework de agente nenhum. Só o loop prompt, tool use e resposta.

· 3 min · Lucas Souza
Reranker: o passo que faz seu RAG parar de devolver lixo
Tutoriais

Reranker: o passo que faz seu RAG parar de devolver lixo

A busca vetorial traz 20 candidatos "parecidos" — mas parecido não é relevante. O reranker reordena por relevância real antes de mandar pro modelo. Este post mostra cross-encoder vs busca híbrida e quando cada um vale, com código rodando.

· 9 min · Lucas Souza
RAG do zero: chunking, embeddings e busca que funciona
Tutoriais

RAG do zero: chunking, embeddings e busca que funciona

RAG não é mágica: é quebrar texto, virar vetor e buscar bem. O passo a passo de um RAG do zero — chunking recursive com overlap, embeddings com text-embedding-3-small e busca por similaridade no Postgres com pgvector e índice HNSW. Errar o chunking é onde 80% dos RAGs nascem ruins.

· 10 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando