#Performance
RAG não é só vector search: combinando busca semântica, SQL e tools no mesmo agente
Vector-only, hybrid (BM25 + vetor + RRF) e o stack completo com SQL e reranker como tools separadas: comparação prática com benchmarks reais e código de produção.
Programmatic Tool Calling: por que executar suas ferramentas em código é o futuro do agente
Function calling clássico vai virar legado. Programmatic tool calling do Claude troca o loop turno-a-turno por código Python no sandbox: 37% menos tokens, paralelismo nativo via asyncio.gather e composição em um único script. A gente compara latência, tokens, debug, e fecha com um agente que escreve o próprio orquestrador.
Cortando custo em 80%: prompt caching, batch e quando NÃO usar reranker
A maioria dos agentes em produção sangra dinheiro em chamada repetida pra LLM. Três alavancas que cortam custo: prompt caching no system prompt do harness, Batch API pra workloads assíncronos e a decisão fria de quando o reranker é só caro e lento.
Tracking 24/7: do agente que responde "quanto custa?" ao agente que avisa "baixou agora"
Como evoluir do agente que responde "quanto custa?" para o agente que avisa "baixou agora": cron, webhook, idempotência, deduplicação de alerta e janelas de monitoramento sem estourar custo. Com snippets em Laravel e o que muda no harness quando o agente passa a viver sozinho.
Cross-encoder reranker: o componente que mais eleva qualidade do seu agente por dólar
Retrieval traz 100 candidatos, reranker escolhe os 10 certos. Entenda o trade-off latência x precisão, quando rerankar 50 vs. 200 documentos e por que cross-encoder é o investimento de melhor ROI antes de trocar para um LLM mais caro.
O Laravel é lento? Entenda por que sua aplicação não escala
Entenda por que o Laravel não é o culpado pela lentidão das suas aplicações. Neste artigo, mostramos como o conceito de SARGABLE afeta diretamente a performance das suas queries, por que funções como whereDate() destroem índices e como resolver isso com whereBetween().
Otimize sua aplicação Laravel com o novo Memoized Cache Driver (Laravel 12.9)
O Laravel 12.9 trouxe uma novidade poderosa: o Memoized Cache Driver. Essa feature otimiza o desempenho das aplicações ao armazenar em memória os valores obtidos do cache durante o tempo de execução da requisição, evitando múltiplos acessos ao cache.
A Importância do Eager Loading no Laravel: Evitando o Problema N+1
O eager loading é uma técnica essencial no Laravel para otimizar o desempenho de aplicações, evitando o problema de consultas N+1. Este artigo explica como o eager loading funciona, os impactos de não utilizá-lo e como configurar o Laravel para prevenir problemas relacionados ao lazy loading, incluindo o uso do recurso de carregamento automático de relacionamentos.
Como alcancei pontuações quase perfeitas no Google Lighthouse em um blog feito com Laravel / Filament
Veja como consegui atingir pontuações acima de 90 no Google Lighthouse, melhorando drasticamente o desempenho dos meus sites e proporcionando uma experiência excepcional para os usuários.
FilamentPHP V4 está chegando: veja as principais novidades!
A versão 4 do FilamentPHP promete revolucionar o desenvolvimento de painéis administrativos com Laravel e Livewire. Neste artigo, compartilho as principais mudanças arquiteturais, melhorias de desempenho e recursos inéditos que vão transformar a experiência dos desenvolvedores.
Observabilidade em Sistemas Modernos
Explore ferramentas de observabilidade como LogRocket, Bugsnag, Rollbar e outras para monitoramento, análise de logs e gestão de erros em sistemas modernos. Compare planos gratuitos, destaques e integrações para encontrar a melhor solução para sua equipe.
Como Executar Processos em Concorrência no Laravel: Importando Grandes Arquivos CSV
Aprenda a usar a facade Concurrency do Laravel para executar tarefas em paralelo e melhorar a performance, com um exemplo prático de importação de grandes arquivos CSV.