GPT-5.6: Sol, Terra ou Luna: qual usar e quanto custa

A OpenAI acabou de matar a ideia de "o modelo do ChatGPT". Agora são três.

No dia 26 de junho de 2026 saiu o GPT-5.6 — e ele não veio como um modelo só. Veio como uma família: Sol, Terra e Luna. Mesma geração, três tiers de capacidade, três preços, três casos de uso. A pergunta do dev deixou de ser "vale trocar pro 5.6?" e virou "qual dos três eu coloco em produção?".

Esse post responde isso. O que muda entre Sol, Terra e Luna, quanto custa cada um, e quando usar cada um sem queimar dinheiro à toa. Sem hype — só a engenharia da escolha.

TL;DR

O que é: GPT-5.6, a nova geração da OpenAI, dividida em três modelos por tier de capacidade.
Os três: Sol (topo), Terra (equilíbrio), Luna (barato e rápido).
Preço por 1M de tokens: Sol $5/$30 · Terra $2,50/$15 · Luna $1/$6 (input/output).
Acesso: preview restrito a ~20 organizações via API e Codex, sob coordenação do governo dos EUA. Liberação ampla "nas próximas semanas".
Pra acompanhar a liberação: o rastreador do GPT 5.6 que mantemos atualizado.

A mudança no nome (e por que ela importa pra você)

Presta atenção nisso, porque muda como você escolhe modelo daqui pra frente.

Antes, o nome era uma régua única: 4, 4o, 5, 5.5. Quanto maior o número, melhor (e mais caro) o modelo. Simples e burro.

No GPT-5.6 a OpenAI separou as duas coisas. O número (5.6) diz a geração. O nome — Sol, Terra ou Luna — diz o tier de capacidade. E cada tier evolui na própria cadência: um Sol da próxima geração pode chegar antes de um novo Terra, por exemplo.

Na prática, isso te obriga a pensar como engenheiro, não como consumidor. Você não pega "o melhor modelo". Você escolhe o tier certo pra cada tarefa: inteligência, velocidade ou custo. É a mesma lógica de quem dimensiona infra — você não roda tudo na máquina mais cara só porque ela existe.

Sol: o topo, pra quando errar sai caro

Sol é o modelo mais forte que a OpenAI já lançou. O foco dele é trabalho agêntico pesado — ganhos declarados em coding, biologia e cybersecurity.

Duas novidades fazem o Sol valer o nome:

max reasoning effort: dá ao modelo o máximo de tempo pra raciocinar fundo antes de responder. É o "pensa mais, custa mais".
Modo ultra: vai além de um agente só. Ele orquestra subagents pra quebrar problema complexo em partes. É a OpenAI colocando a arquitetura multiagente dentro do próprio modelo.

O número que chama atenção: o Sol Ultra cravou 91,91% no Terminal-Bench 2.1, recorde no benchmark de automação de linha de comando. Vale a ressalva honesta — é número da própria OpenAI, sem verificação independente ainda. Trate como cenário de lançamento, não como verdade fechada.

Preço: $5 de input / $30 de output por 1M de tokens.

Use quando: a tarefa é longa, agêntica e difícil — refactor grande, automação de terminal que não pode falhar, análise de segurança, pipeline que toma decisão. Onde acerto vale mais do que a conta no fim do mês.

Terra: o equilíbrio que provavelmente vira seu default

Terra é o "balanced model for everyday work". E aqui está o ponto que mais importa pra produção: ele entrega performance competitiva com o GPT-5.5 pela metade do preço.

Pensa no que isso significa. Se você roda 5.5 hoje, o Terra é praticamente a mesma qualidade com a conta cortada ao meio. Não é o tier que ganha headline de benchmark — é o que ganha no boleto.

Preço: $2,50 de input / $15 de output por 1M de tokens.

Use quando: for o seu fluxo de produção do dia a dia — geração de texto, código de complexidade média, chat com usuário, RAG. O lugar onde você quer qualidade alta e consistente sem pagar preço de flagship em toda chamada. Pra maioria dos produtos, é aqui que a escolha racional cai.

Luna: o barato e rápido, pra escala

Luna é o "fast and affordable". Capacidade forte pelo menor custo da família. É o tier que você usa quando o volume é grande e a profundidade de raciocínio não é o gargalo.

Preço: $1 de input / $6 de output por 1M de tokens. Cinco vezes mais barato que o Sol no input.

Use quando: classificação, extração estruturada, moderação, roteamento, resposta curta de chat, qualquer coisa de alto volume onde latência e custo pesam mais do que a última gota de inteligência. Luna é o modelo que segura uma feature que dispara milhares de chamadas sem estourar o orçamento.

Um padrão de arquitetura que já dá pra desenhar: Luna na linha de frente filtrando e classificando, escalando pro Terra ou Sol só os casos que realmente precisam pensar. Roteamento por tier é o jeito de não pagar caro por tarefa barata.

Resumo: qual modelo do GPT-5.6 escolher

Tier	Preço (in/out por 1M)	Pra que serve	Use quando
Sol	$5 / $30	Flagship agêntico (coding, bio, cyber) + modo ultra	Tarefa difícil e longa onde acerto > custo
Terra	$2,50 / $15	Qualidade de GPT-5.5 pela metade do preço	Seu default de produção
Luna	$1 / $6	Rápido e barato, pra escala	Alto volume, rotina, custo/latência mandam

O detalhe que muda a conta de verdade: o caching novo

Preço de tabela não é o custo real. Quem roda LLM em produção sabe que o que define a fatura é quanto contexto você reenvia em cada chamada.

O GPT-5.6 trouxe um prompt caching mais previsível: agora dá pra marcar cache breakpoints explícitos e o cache tem vida mínima de 30 minutos. A escrita no cache é cobrada a 1,25x o input normal, mas a leitura mantém os 90% de desconto.

Tradução pra produto: se você tem um system prompt grande, contexto fixo ou few-shot que se repete, dá pra travar isso no cache e pagar quase nada nas leituras seguintes. Num agente que faz dezenas de chamadas com o mesmo contexto-base, isso muda a economia mais do que escolher Luna em vez de Terra. Caching bem desenhado é otimização de custo de verdade — não é firula.

O porém: você (ainda) não pode usar

Aqui vem o balde de água fria. O GPT-5.6 saiu restrito. O preview está liberado pra um grupo pequeno — cerca de 20 organizações — via API e Codex, e a lista de quem entrou foi compartilhada com o governo dos Estados Unidos. É consequência da ordem executiva de Trump sobre avaliação de modelos de fronteira.

A própria OpenAI não gostou e deixou claro: "não acreditamos que esse tipo de processo de acesso via governo deva virar o padrão de longo prazo. Ele mantém as melhores ferramentas longe de usuários, desenvolvedores, empresas e defensores de cyber que precisam delas."

Pro dev no Brasil, o recado é direto: por enquanto, isso é notícia de spec e preço, não ferramenta na sua mão. A liberação ampla — em ChatGPT, Codex e API — foi prometida pra "próximas semanas". Até lá, dá pra desenhar a arquitetura de tiers, mas não pra rodar.

E tem o segundo porém, igualmente importante: ainda não existe benchmark independente dos três. Os números são da OpenAI. Quando o acesso abrir e a comunidade testar de verdade, a gente atualiza — é por isso que o rastreador do GPT 5.6 existe e segue vivo.

A escolha é de engenharia, não de marketing

Sol, Terra e Luna em uma frase cada:

Sol pensa fundo quando a tarefa é difícil — e cobra por isso.
Terra é o GPT-5.5 pela metade do preço — provavelmente o seu default.
Luna segura a escala barata — rotina e alto volume.

O ponto não é qual é "o melhor". É que a OpenAI te deu três ferramentas e a responsabilidade de escolher. Quem trata isso como decisão de arquitetura — roteando por tier, usando caching, medindo custo por tarefa — paga menos e entrega melhor. Quem joga tudo no modelo mais caro porque "é o top" está terceirizando raciocínio que devia ser seu.

Quando o acesso abrir, a primeira coisa a fazer não é trocar tudo pro Sol. É olhar suas chamadas, separar o que precisa pensar do que só precisa responder, e dimensionar. Isso é engenharia. O resto é hype.

E esse pulo — sair do prompt solto e chegar num sistema que escolhe modelo, roteia por tier e aguenta produção — é exatamente o que a gente constrói ao vivo, com código rodando, no Do Prompt ao Harness: Construindo um Agent de Vendas.

FAQ

Qual é o mais barato? Luna, a $1 de input / $6 de output por 1M de tokens — cinco vezes mais barato que o Sol no input.

Luna serve pra programar? Pra código simples e de alto volume, sim. Pra refactor pesado ou tarefa agêntica longa, o tier certo é Terra ou Sol. Luna foi posicionado pra velocidade e custo, não pra profundidade de raciocínio.

Terra é melhor que o GPT-5.5? A OpenAI diz que o Terra entrega performance competitiva com o GPT-5.5 pela metade do preço. Ou seja: qualidade equivalente, conta menor. Falta validação independente.

Já dá pra usar no Brasil? Ainda não de forma geral. O lançamento é um preview restrito a ~20 organizações sob coordenação do governo dos EUA. A liberação ampla foi prometida pra "próximas semanas".

Qual a diferença entre max e ultra? max é esforço de raciocínio — dá ao Sol mais tempo pra pensar fundo. ultra vai além: usa subagents pra quebrar problemas complexos em partes. max é pensar mais; ultra é coordenar vários raciocínios.

GPT-5.6: Sol, Terra ou Luna — qual modelo da OpenAI usar (e quanto custa cada um)

TL;DR

A mudança no nome (e por que ela importa pra você)

Sol: o topo, pra quando errar sai caro

Terra: o equilíbrio que provavelmente vira seu default

Luna: o barato e rápido, pra escala

Resumo: qual modelo do GPT-5.6 escolher

O detalhe que muda a conta de verdade: o caching novo

O porém: você (ainda) não pode usar

A escolha é de engenharia, não de marketing

FAQ

Você também pode gostar

GPT 5.6 foi lançado: Sol, Terra e Luna, preços e tudo o que sabemos (rastreador)

GPT-5.6 liberado só com aval do governo dos EUA: o que muda pra quem constrói com IA

GPT-5 na prática: vale trocar o que você já usa pra programar?

Fable 5 bloqueado: o OpenRouter Fusion prova que painel de modelos já supera qualquer frontier