#Boas Praticas

01 #openai · #boas-praticas

10 boas práticas para usar o Codex (direto da documentação oficial)

Varremos a documentação oficial nova do Codex (learn.chatgpt.com) e condensamos as 10 boas práticas que a própria OpenAI recomenda: prompting por resultado, AGENTS.md vivo, permissões restritas, escolha de modelo, skills, cloud e automação.

26 Jul · 8 min ›

02 #laravel · #performance

Filas no Laravel em 2026: Horizon, Redis e tracing distribuído

Job de fila em 2026 chama LLM, espera 90s, gasta dólar em token e ainda pode falhar silencioso. Aqui vai o desenho de stack que segura: Horizon, Redis 7, filas separadas por SLA, retry com idempotency key e tracing OpenTelemetry de ponta a ponta.

27 Mai · 11 min ›

03 #laravel · #performance

Deploy de Laravel em produção em 2026: Forge, Cloud, Sail ou Kubernetes?

Quatro caminhos pra rodar Laravel em produção em 2026 (Forge, Cloud, Sail+VPS ou Kubernetes) comparados por cenário, com a armadilha que mata seu banco e o checklist de 18 itens antes do go-live.

25 Mai · 14 min ›

04 #tool-use · #llm-as-a-judge

5 padrões de prompt que sobem o sinal do code review com LLM de 12% pra 67%

Bot de code review que comenta "considere adicionar testes" em todo PR vira meme rápido. Cinco padrões — diff-anchored, severity gate, tool use antes do palpite, citation obrigatória e self-grading com threshold — sobem o signal ratio acima de 60% e mantêm o time confiando no review. Inclui workflow Laravel pronto.

24 Mai · 14 min ›

05 #performance · #ia

Quando NÃO usar Agentic Code: 8 cenários onde o agente é prejuízo

Curva de hype joga todo mundo no extremo. Aqui está a lista honesta de 8 cenários onde, em 2026, o agente custa mais caro, demora mais e ainda erra mais que o time fazendo na mão, com explicação técnica, benchmarks e dor de produção.

13 Mai · 12 min ›

06 #laravel · #php

TDD com agentes: como escrever testes que sobrevivem ao código gerado

Agente deletou o teste pra fazer passar. Aconteceu, vai acontecer. METR documentou em 2025 modelos modificando timers e graders pra parecer rápido. TDD com agente exige inversão: o teste é a especificação executável, quem escreve o teste manda no agente.

13 Mai · 10 min ›

07 #openai · #ia

Model Graders: usando LLMs para avaliar LLMs (e os 3 erros que invalidam o seu eval)

LLM-as-judge é o atalho que todo time de IA usa pra escalar evals. Mas tem três armadilhas que silenciosamente invalidam o pipeline: self-preference, position e verbosity bias, e calibração ausente. Cobrimos os três padrões de prompt para grader (rubric, reference, pairwise) e como blindar contra cada erro com mitigação concreta.

08 Mai · 12 min ›

08 #harness · #arquitetura-de-software

Versionando specs: como manter documentação viva sem virar mais um README abandonado

Tripé Git + spec + ADR (Architecture Decision Records) que mantém doc viva ao lado do código, com hooks de pré-commit que travam o drift. Estrutura mínima, scripts de validação e configuração pre-commit prontos para colar — sem precisar contratar engenheiro de documentação.

06 Mai · 5 min ›

09 #ai-agents · #harness

Como escrever uma spec que o agente realmente entende (e não inventa em cima)

A maior parte dos bugs de agente em 2026 não é o modelo errando, é a spec mentindo. Três anti-padrões reais (ambiguidade, contexto inútil e regra implícita) com exemplos antes/depois e checklist de sete pontos pra validar a spec antes de mandar pro Claude Code.

04 Mai · 10 min ›

10 #ia · #ai-agents

5 sinais de que sua especificação virou burocracia (e como voltar à base bem feita)

Spec-driven virou padrão em 2026, e com ele veio o risco do pêndulo: spec gigante, aprovada em comitê, ignorada pelo time e filtrada pelo agente. Cinco sintomas concretos e o ajuste prático para cada um.

03 Mai · 7 min ›