Lucas Souza

13 #ia · #llm

Como rodar um LLM local: guia do zero (Ollama, hardware e quando vale a pena)

Dá pra rodar um modelo decente no seu notebook, sem mandar um byte pra nuvem. O guia de quando isso faz sentido, o que roda no seu hardware, como subir com Ollama e quando local ganha da API.

22 Jul · 9 min ›

14 #ia · #google

Gemini 3.6 Flash chegou: benchmarks, preço e por que o Google lançou o Flash antes do Pro

O Google lançou o Gemini 3.6 Flash prometendo qualidade de Pro com preço de Flash. Testei o anúncio contra os números: benchmarks oficiais, preço por token, o tier Flash-Lite — e o que é fato e o que é rumor na história do Pro que não chega.

21 Jul · 9 min ›

15 #ia · #rag

O que é fine tuning? Guia prático (e quando NÃO usar)

Todo mundo acha que precisa de fine tuning. Quase ninguém precisa. O guia direto do que é, como funciona e o critério honesto de quando usar vs RAG vs contexto.

21 Jul · 10 min ›

16 #ia · #guardrails

Kimi K3 corrigiu 15 bugs que Codex e Fable recusaram — e a guerra dos guardrails começou

O Kimi K3 corrigiu 15 falhas de segurança que Codex e Fable recusaram por "cyber guardrails". Na mesma semana, a HuggingFace foi invadida e teve a perícia travada pelo próprio guardrail. Quando o freio da IA protege, e quando desarma o defensor.

20 Jul · 11 min ›

17 #ia · #claude

Fable 5 e a Conjectura Jacobiana: o problema de 90 anos que a IA parece ter derrubado

O Fable 5 ajudou o matemático Levent Alpöge a produzir um contraexemplo para a Conjectura Jacobiana, aberta desde 1939. O que é a conjectura sem jargão, o que é um contraexemplo, por que dessa vez a conferência é fácil e o que isso diz sobre IA fazendo matemática de fronteira.

20 Jul · 9 min ›

18 #ia · #llm

Qwen 3.8 Max chegou: a Alibaba lançou um "Fable open source"? Benchmarks e primeiro teste

A Alibaba soltou o Qwen 3.8 Max, modelo de 2.4 trilhões de parâmetros que ela diz ser o segundo do mundo, atrás só do Fable 5. Sem benchmark público. Testamos os dois lados da briga: quem grita "melhor que Sonnet" e quem chama de tropeço.

20 Jul · 8 min ›

19 #openai · #ia

Codex com contexto reduzido: OpenAI cortou de 372k pra 272k sem avisar

A OpenAI baixou o contexto efetivo do modelo do Codex de 372k para 272k tokens numa atualização silenciosa e transformou o antigo teto numa linha onde o preço dobra. O que foi cortado, por que dói em sessão longa e monorepo, como confirmar que você foi afetado e os workarounds que existem hoje.

20 Jul · 9 min ›

20 #openai · #ia

IA vai ficar mais cara? A conta real da OpenAI e da Anthropic

O X grita que vem o "grande rollback" da IA; a prática mostra OpenAI e Anthropic brigando por quem deixa você usar mais. Fui atrás dos números verificados: preço por token despencando 83%, custo por tarefa subindo 3x-18x ao ano, margem de 70% em quem paga e prejuízo projetado de US$ 74 bi. Os dois lados estão errados, e a variável que decide tudo é uma só.

18 Jul · 16 min ›

21 #laravel · #ai-agents

Como criar um agente de IA para WhatsApp: passo a passo com API (sem depender de SaaS)

Tutorial dev: monte um agente de IA no WhatsApp com Evolution API e Claude. Webhook, código, memória e a conta real de custo, sem mensalidade de SaaS.

18 Jul · 9 min ›

22 #ia · #claude

IPO da Anthropic em outubro: o que muda pra quem usa Claude (preços, limites e o risco Kimi K3)

A Anthropic agendou reuniões com investidores mirando IPO já em outubro de 2026, avaliada em US$ 965 bilhões. O que a pressão por receita pode mudar no preço do Claude Code, nos limites de uso e no foco enterprise, e por que Kimi K3 e GLM 5.2 espremem essa avaliação. Post vivo: atualizado quando sair o anúncio formal.

17 Jul · 11 min ›

23 #ia · #agentes

1Password for Claude: como o Claude faz login sozinho sem ver sua senha

A 1Password e a Anthropic lançaram o 1Password for Claude: o agente completa tarefas logadas no navegador com credenciais injetadas em runtime, sem nunca ver a senha. Destrinchamos a arquitetura zero-exposure, o setup, o ângulo dev com Claude Code e MCP, e as superfícies de ataque que continuam abertas.

17 Jul · 10 min ›

24 #ia · #llm

Kimi K3 chegou: o "Fable 5 chinês" que bate o Opus 4.8 — o que é real nos benchmarks

A Moonshot AI lançou o Kimi K3: 2,8 trilhões de parâmetros, pesos abertos e 3º lugar na Artificial Analysis, acima do Claude Opus 4.8. Separamos o benchmark verificável do hype — incluindo o "5x mais barato" que não fecha na conta.

17 Jul · 10 min ›