#Anthropic

Engenharia de IA não é Data Science: 7 diferenças que separam disciplina de hype
Notícias

Engenharia de IA não é Data Science: 7 diferenças que separam disciplina de hype

Recrutador chama as duas de "vaga de IA". CTO que confunde uma com a outra paga seis meses de retrabalho. Põe lado a lado data science e engenharia de IA em sete eixos: foco, métrica, stack, output, tempo de feedback, quem migra mais rápido e por que essa confusão atrasa carreira.

· 9 min · Lucas Souza
Agentic Code: o que muda quando o agente escreve, executa e testa o próprio código
Notícias

Agentic Code: o que muda quando o agente escreve, executa e testa o próprio código

Vibe coding deixou o dev no volante. SDD desenhou o mapa. Agentic Code tira o dev do carro e dá a chave pro agente, com freio de mão na mão. Cunhagem do termo em PT-BR, taxonomia de 4 níveis de autonomia, anatomia do ciclo plan/act/observe/reflect, demo comparativa de CRUD em três paradigmas, modos de falha reais e o que o harness precisa garantir pra rodar agente em produção sem quebrar tudo.

· 11 min · Lucas Souza
Model Graders: usando LLMs para avaliar LLMs (e os 3 erros que invalidam o seu eval)
Tutoriais

Model Graders: usando LLMs para avaliar LLMs (e os 3 erros que invalidam o seu eval)

LLM-as-judge é o atalho que todo time de IA usa pra escalar evals. Mas tem três armadilhas que silenciosamente invalidam o pipeline: self-preference, position e verbosity bias, e calibração ausente. Cobrimos os três padrões de prompt para grader (rubric, reference, pairwise) e como blindar contra cada erro com mitigação concreta.

· 12 min · Lucas Souza
Engenharia de contexto vence prompt engineering: por que o que você NÃO coloca no prompt importa mais
Tutoriais

Engenharia de contexto vence prompt engineering: por que o que você NÃO coloca no prompt importa mais

Karpathy e Lütke dispararam em 2025: o nome certo não é prompt engineering, é engenharia de contexto. Três experimentos lado a lado da mesma tarefa mostram, com tokens, dólar e testes passando, por que o que você NÃO coloca no prompt importa mais que o que coloca.

· 11 min · Lucas Souza
Do prompt frágil ao sistema confiável: pipeline de eval contínuo para prompts em produção
Tutoriais

Do prompt frágil ao sistema confiável: pipeline de eval contínuo para prompts em produção

Trocou o modelo, mudou uma frase no system, ajustou um exemplo, e 30% dos casos regrediram em silêncio. Pipeline de eval contínuo no CI resolve isso. Dataset versionado, runner em cada PR, gate de qualidade que barra merge. Mão na massa com Promptfoo e GitHub Actions.

· 10 min · Lucas Souza
Hooks, Slash Commands e MCPs: a anatomia de um harness produtivo
Tutoriais

Hooks, Slash Commands e MCPs: a anatomia de um harness produtivo

Claude Code não é só um modelo, é um harness com três pontos de extensão (hooks, slash commands e MCPs). Cada um resolve um problema diferente. Esse post disseca peça por peça, com exemplos reais de configuração que rodam todo dia em projetos Laravel.

· 10 min · Lucas Souza
RAG não é só vector search: combinando busca semântica, SQL e tools no mesmo agente
Tutoriais

RAG não é só vector search: combinando busca semântica, SQL e tools no mesmo agente

Vector-only, hybrid (BM25 + vetor + RRF) e o stack completo com SQL e reranker como tools separadas: comparação prática com benchmarks reais e código de produção.

· 11 min · Lucas Souza
Subagentes na prática: dividindo contexto entre Claudes para não estourar o token budget
Tutoriais

Subagentes na prática: dividindo contexto entre Claudes para não estourar o token budget

Padrão pesquisador, executor e validador na prática. Por que três Claudes especializados batem um agente gigante em qualidade e travam menos no limite de contexto. Com números reais publicados pela Anthropic.

· 10 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando