GPT-5.6: Sol, Terra ou Luna — qual modelo da OpenAI usar (e quanto custa cada um)
A OpenAI acabou de matar a ideia de "o modelo do ChatGPT". Agora são três.
No dia 26 de junho de 2026 saiu o GPT-5.6 — e ele não veio como um modelo só. Veio como uma família: Sol, Terra e Luna. Mesma geração, três tiers de capacidade, três preços, três casos de uso. A pergunta do dev deixou de ser "vale trocar pro 5.6?" e virou "qual dos três eu coloco em produção?".
Esse post responde isso. O que muda entre Sol, Terra e Luna, quanto custa cada um, e quando usar cada um sem queimar dinheiro à toa. Sem hype — só a engenharia da escolha.
TL;DR
- O que é: GPT-5.6, a nova geração da OpenAI, dividida em três modelos por tier de capacidade.
- Os três: Sol (topo), Terra (equilíbrio), Luna (barato e rápido).
- Preço por 1M de tokens: Sol $5/$30 · Terra $2,50/$15 · Luna $1/$6 (input/output).
- Acesso: preview restrito a ~20 organizações via API e Codex, sob coordenação do governo dos EUA. Liberação ampla "nas próximas semanas".
- Pra acompanhar a liberação: o rastreador do GPT 5.6 que mantemos atualizado.
A mudança no nome (e por que ela importa pra você)
Presta atenção nisso, porque muda como você escolhe modelo daqui pra frente.
Antes, o nome era uma régua única: 4, 4o, 5, 5.5. Quanto maior o número, melhor (e mais caro) o modelo. Simples e burro.
No GPT-5.6 a OpenAI separou as duas coisas. O número (5.6) diz a geração. O nome — Sol, Terra ou Luna — diz o tier de capacidade. E cada tier evolui na própria cadência: um Sol da próxima geração pode chegar antes de um novo Terra, por exemplo.
Na prática, isso te obriga a pensar como engenheiro, não como consumidor. Você não pega "o melhor modelo". Você escolhe o tier certo pra cada tarefa: inteligência, velocidade ou custo. É a mesma lógica de quem dimensiona infra — você não roda tudo na máquina mais cara só porque ela existe.
Sol: o topo, pra quando errar sai caro
Sol é o modelo mais forte que a OpenAI já lançou. O foco dele é trabalho agêntico pesado — ganhos declarados em coding, biologia e cybersecurity.
Duas novidades fazem o Sol valer o nome:
maxreasoning effort: dá ao modelo o máximo de tempo pra raciocinar fundo antes de responder. É o "pensa mais, custa mais".- Modo
ultra: vai além de um agente só. Ele orquestra subagents pra quebrar problema complexo em partes. É a OpenAI colocando a arquitetura multiagente dentro do próprio modelo.
O número que chama atenção: o Sol Ultra cravou 91,91% no Terminal-Bench 2.1, recorde no benchmark de automação de linha de comando. Vale a ressalva honesta — é número da própria OpenAI, sem verificação independente ainda. Trate como cenário de lançamento, não como verdade fechada.
Preço: $5 de input / $30 de output por 1M de tokens.
Use quando: a tarefa é longa, agêntica e difícil — refactor grande, automação de terminal que não pode falhar, análise de segurança, pipeline que toma decisão. Onde acerto vale mais do que a conta no fim do mês.
Terra: o equilíbrio que provavelmente vira seu default
Terra é o "balanced model for everyday work". E aqui está o ponto que mais importa pra produção: ele entrega performance competitiva com o GPT-5.5 pela metade do preço.
Pensa no que isso significa. Se você roda 5.5 hoje, o Terra é praticamente a mesma qualidade com a conta cortada ao meio. Não é o tier que ganha headline de benchmark — é o que ganha no boleto.
Preço: $2,50 de input / $15 de output por 1M de tokens.
Use quando: for o seu fluxo de produção do dia a dia — geração de texto, código de complexidade média, chat com usuário, RAG. O lugar onde você quer qualidade alta e consistente sem pagar preço de flagship em toda chamada. Pra maioria dos produtos, é aqui que a escolha racional cai.
Luna: o barato e rápido, pra escala
Luna é o "fast and affordable". Capacidade forte pelo menor custo da família. É o tier que você usa quando o volume é grande e a profundidade de raciocínio não é o gargalo.
Preço: $1 de input / $6 de output por 1M de tokens. Cinco vezes mais barato que o Sol no input.
Use quando: classificação, extração estruturada, moderação, roteamento, resposta curta de chat, qualquer coisa de alto volume onde latência e custo pesam mais do que a última gota de inteligência. Luna é o modelo que segura uma feature que dispara milhares de chamadas sem estourar o orçamento.
Um padrão de arquitetura que já dá pra desenhar: Luna na linha de frente filtrando e classificando, escalando pro Terra ou Sol só os casos que realmente precisam pensar. Roteamento por tier é o jeito de não pagar caro por tarefa barata.
Resumo: qual modelo do GPT-5.6 escolher
| Tier | Preço (in/out por 1M) | Pra que serve | Use quando |
|---|---|---|---|
| Sol | $5 / $30 | Flagship agêntico (coding, bio, cyber) + modo ultra | Tarefa difícil e longa onde acerto > custo |
| Terra | $2,50 / $15 | Qualidade de GPT-5.5 pela metade do preço | Seu default de produção |
| Luna | $1 / $6 | Rápido e barato, pra escala | Alto volume, rotina, custo/latência mandam |
O detalhe que muda a conta de verdade: o caching novo
Preço de tabela não é o custo real. Quem roda LLM em produção sabe que o que define a fatura é quanto contexto você reenvia em cada chamada.
O GPT-5.6 trouxe um prompt caching mais previsível: agora dá pra marcar cache breakpoints explícitos e o cache tem vida mínima de 30 minutos. A escrita no cache é cobrada a 1,25x o input normal, mas a leitura mantém os 90% de desconto.
Tradução pra produto: se você tem um system prompt grande, contexto fixo ou few-shot que se repete, dá pra travar isso no cache e pagar quase nada nas leituras seguintes. Num agente que faz dezenas de chamadas com o mesmo contexto-base, isso muda a economia mais do que escolher Luna em vez de Terra. Caching bem desenhado é otimização de custo de verdade — não é firula.
O porém: você (ainda) não pode usar
Aqui vem o balde de água fria. O GPT-5.6 saiu restrito. O preview está liberado pra um grupo pequeno — cerca de 20 organizações — via API e Codex, e a lista de quem entrou foi compartilhada com o governo dos Estados Unidos. É consequência da ordem executiva de Trump sobre avaliação de modelos de fronteira.
A própria OpenAI não gostou e deixou claro: "não acreditamos que esse tipo de processo de acesso via governo deva virar o padrão de longo prazo. Ele mantém as melhores ferramentas longe de usuários, desenvolvedores, empresas e defensores de cyber que precisam delas."
Pro dev no Brasil, o recado é direto: por enquanto, isso é notícia de spec e preço, não ferramenta na sua mão. A liberação ampla — em ChatGPT, Codex e API — foi prometida pra "próximas semanas". Até lá, dá pra desenhar a arquitetura de tiers, mas não pra rodar.
E tem o segundo porém, igualmente importante: ainda não existe benchmark independente dos três. Os números são da OpenAI. Quando o acesso abrir e a comunidade testar de verdade, a gente atualiza — é por isso que o rastreador do GPT 5.6 existe e segue vivo.
A escolha é de engenharia, não de marketing
Sol, Terra e Luna em uma frase cada:
- Sol pensa fundo quando a tarefa é difícil — e cobra por isso.
- Terra é o GPT-5.5 pela metade do preço — provavelmente o seu default.
- Luna segura a escala barata — rotina e alto volume.
O ponto não é qual é "o melhor". É que a OpenAI te deu três ferramentas e a responsabilidade de escolher. Quem trata isso como decisão de arquitetura — roteando por tier, usando caching, medindo custo por tarefa — paga menos e entrega melhor. Quem joga tudo no modelo mais caro porque "é o top" está terceirizando raciocínio que devia ser seu.
Quando o acesso abrir, a primeira coisa a fazer não é trocar tudo pro Sol. É olhar suas chamadas, separar o que precisa pensar do que só precisa responder, e dimensionar. Isso é engenharia. O resto é hype.
E esse pulo — sair do prompt solto e chegar num sistema que escolhe modelo, roteia por tier e aguenta produção — é exatamente o que a gente constrói ao vivo, com código rodando, no Do Prompt ao Harness: Construindo um Agent de Vendas.
FAQ
Qual é o mais barato? Luna, a $1 de input / $6 de output por 1M de tokens — cinco vezes mais barato que o Sol no input.
Luna serve pra programar? Pra código simples e de alto volume, sim. Pra refactor pesado ou tarefa agêntica longa, o tier certo é Terra ou Sol. Luna foi posicionado pra velocidade e custo, não pra profundidade de raciocínio.
Terra é melhor que o GPT-5.5? A OpenAI diz que o Terra entrega performance competitiva com o GPT-5.5 pela metade do preço. Ou seja: qualidade equivalente, conta menor. Falta validação independente.
Já dá pra usar no Brasil? Ainda não de forma geral. O lançamento é um preview restrito a ~20 organizações sob coordenação do governo dos EUA. A liberação ampla foi prometida pra "próximas semanas".
Qual a diferença entre max e ultra?
max é esforço de raciocínio — dá ao Sol mais tempo pra pensar fundo. ultra vai além: usa subagents pra quebrar problemas complexos em partes. max é pensar mais; ultra é coordenar vários raciocínios.
{AI Engineer} — apaixonado por Laravel, arquitetura de software e construir produtos com impacto. Compartilho aqui tutoriais, descobertas e reflexões sobre o dia a dia de engenharia.
Você também pode gostar
GPT 5.6 foi lançado: Sol, Terra e Luna, preços e tudo o que sabemos (rastreador)
O GPT 5.6 foi lançado em três modelos (Sol, Terra e Luna), com acesso restrito pelo governo dos EUA. O que se confirmou dos vazamentos, os preços e o que ainda é incógnita.
GPT-5.6 liberado só com aval do governo dos EUA: o que muda pra quem constrói com IA
Pela primeira vez o governo dos EUA decidiu quem pode usar um modelo de IA antes do lançamento. O caso GPT-5.6, com fontes, e o que muda pra quem constrói software com IA.
GPT-5 na prática: vale trocar o que você já usa pra programar?
GPT-5 está em todo lugar, mas a pergunta de quem programa é só uma: vale trocar o que já funciona? Olhamos código real, custo por tarefa e quando a troca se paga, no tom honesto da marca.
Fable 5 bloqueado: o OpenRouter Fusion prova que painel de modelos já supera qualquer frontier
O Claude Fable 5 durou três dias disponível antes de ser bloqueado pelo governo dos EUA. Enquanto isso, o OpenRouter publicou dados que mudam a pergunta: e se painel de modelos baratos já superar qualquer frontier solo em deep research?