#Ia — Blog Beer And Code

37 #ia · #llm

Mythos da Anthropic "invadiu a NSA em horas"? O que é fato e o que é boato

Viralizou a fala atribuída ao chefe da NSA de que o Mythos, modelo de fronteira da Anthropic, invadiu "quase todos" os sistemas classificados "em horas". O modelo é real. A acusação do hack, nem tanto. Separando fato de boato.

24 Jun · 7 min ›

38 #ia · #llm

Fable 5 casos de uso: o que os EUA construíram nas 72h antes do bloqueio

Curadoria dos projetos reais que devs dos EUA construíram com o Claude Fable 5 nas primeiras 72 horas, antes de a Anthropic desligar o modelo por diretiva de controle de exportação dos EUA.

23 Jun · 9 min ›

39 #ia · #agentes

Sakana Fugu: o modelo que rege Fable 5 e Mythos sem treinar nenhum frontier

A Sakana AI lançou o Sakana Fugu: um LLM treinado para orquestrar um pool de outros modelos (chamar, delegar, verificar e sintetizar) atrás de uma única API compatível com OpenAI. Por que a tese de "capacidade frontier sem o risco de export controls" importa, e o que isso ensina sobre arquitetura de orquestração de agentes.

22 Jun · 8 min ›

40 #ia · #llm

GLM 5.2: o melhor modelo de código open source é chinês, MIT e 6x mais barato

A Z.ai (ex-Zhipu) lançou o GLM 5.2, modelo open-weight de 753B sob licença MIT que fica a 0,7 ponto do Claude Opus 4.8 em código e custa um sexto do preço por token. O que muda pra quem programa com IA no Brasil — incluindo rodar self-host.

22 Jun · 8 min ›

41 #openai · #ia

GPT 5.6 foi lançado: Sol, Terra e Luna, preços e tudo o que sabemos (rastreador)

O GPT 5.6 foi lançado em três modelos (Sol, Terra e Luna), com acesso restrito pelo governo dos EUA. O que se confirmou dos vazamentos, os preços e o que ainda é incógnita.

22 Jun · 9 min ›

42 #ia · #embeddings

RAG híbrido na prática: BM25, embeddings e reranker

Embedding sozinho erra mais do que você imagina. Veja como combinar busca lexical (BM25), busca semântica e um reranker cross-encoder para subir a qualidade do RAG em produção, com código em Python e LangChain.

21 Jun · 9 min ›

43 #ia · #ai-agents

Como criar evals para agentes de IA com LLM-as-a-judge

Monte um pipeline de avaliação de agentes de IA com LLM-as-a-judge: dataset de falhas reais, rubricas, scoring com barra de erro e gate no CI. Sem eval, deploy é no escuro.

21 Jun · 12 min ›

44 #ia · #llm

Modelos de IA open source valem a pena em 2026? A conta real de rodar local

Modelos open source fecharam o gap em 2026. Mas "open source" não é "local" e "local" não é "de graça". A conta honesta de quando rodar LLM local compensa: custo, privacidade e velocidade.

20 Jun · 8 min ›

45 #ia · #gestao

Prontidão para IA: como deixar sua empresa pronta de verdade

Comprar licença de IA não deixa a empresa pronta pra IA. Um framework de prontidão para IA em quatro frentes — dados, processos, pessoas e governança — com os números que mostram onde a maioria trava.

20 Jun · 10 min ›

46 #openai · #ia

Qual IA usar para programar em 2026: Claude Code vs Codex

Comparativo prático entre Claude Code e Codex para coding agêntico em 2026: onde cada um ganha em repo real, terminal e custo. A melhor IA para programar em 2026 não é um nome — é uma decisão de cenário.

19 Jun · 9 min ›

47 #ia · #ai-agents

Como criar um bot no Slack com Claude: um agente de dados no seu workspace

Tutorial de um bot de Slack que responde perguntas sobre seus dados com Claude, baseado no cookbook da Anthropic. Do app_mention ao agente em produção.

19 Jun · 11 min ›

48 #ia · #ai-agents

Como criar um servidor MCP do zero: tools, resources e prompts, do stdio ao HTTP

Tutorial mão na massa pra escrever um servidor MCP em Python do zero — uma tool, um resource e um prompt — rodando em stdio e HTTP, plugado no Claude.

19 Jun · 12 min ›