#Produto IA

Compliance EU AI Act + NIST RMF: checklist de 18 itens para times brasileiros que vendem pra fora
Tutoriais

Compliance EU AI Act + NIST RMF: checklist de 18 itens para times brasileiros que vendem pra fora

EU AI Act entra em vigor em 2 de agosto de 2026, com multas de até 7% do faturamento global. Checklist técnico de 18 itens em ordem de prioridade, mapeado para NIST RMF (Govern/Map/Measure/Manage), com templates Markdown prontos para colar no repositório.

· 14 min · Lucas Souza
Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente
Notícias

Plan-and-Execute: o pattern que cortou 90% do custo do nosso agente

Agente nosso queimava US$ 2.300/mês rodando Claude Opus em loop. Trocamos por Plan-and-Execute: uma chamada cara que planeja, N chamadas baratas que executam. Conta nova: US$ 220/mês com a mesma qualidade. Planilha de tokens, código Laravel (PlanJob + ExecuteStep) e o tipo de fluxo onde esse pattern quebra.

· 10 min · Lucas Souza
MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente
Tutoriais

MCP em produção: OAuth 2.1, schemas validados e o gateway que precisa estar entre você e o agente

MCP local não é MCP em produção. Sair do stdio no laptop pra um servidor MCP servindo agente corporativo exige três mudanças: Streamable HTTP no transporte, OAuth 2.1 com PKCE e Resource Indicators na auth, e JSON Schema 2020-12 estrito nos argumentos. E um gateway corporativo no meio, sempre.

· 17 min · Lucas Souza
RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo
Notícias

RAG + fine-tuning juntos: a arquitetura híbrida que joga a briga "ou um ou outro" no lixo

A briga "RAG ou fine-tuning?" acabou em 2026. 60% dos projetos sérios rodam os dois — fine-tuning controla COMO o modelo responde (formato, tom, raciocínio), RAG controla O QUÊ (fatos atuais e citáveis). Veja o benchmark 96% híbrido vs 89% RAG só vs 91% fine-tuning só, o padrão de roteamento por classificador leve que corta 70–90% do custo, e os cenários em que combinar os dois é overengineering.

· 5 min · Lucas Souza
Laravel Boost: o MCP oficial que ensina o agente a ler seu app antes de gerar código
Notícias

Laravel Boost: o MCP oficial que ensina o agente a ler seu app antes de gerar código

O Laravel Boost é o servidor MCP oficial do time Laravel — expõe routes, models, schema, docs e logs como tools que o agente consulta antes de gerar código. Instalação em 3 comandos, caso real de CRUD Order com 8 relacionamentos comparando com e sem Boost, e o que muda no fluxo de SDD.

· 9 min · Lucas Souza
LLM local vs API em 2026: a planilha real de 90 dias rodando os dois lado a lado
Notícias

LLM local vs API em 2026: a planilha real de 90 dias rodando os dois lado a lado

Chatbot interno de TI, 12 mil chamadas/dia, p95 abaixo de 2 segundos, dados sensíveis. Stack A com Llama 3.3 70B em duas A100 contra Stack B com Claude Haiku 4.5 via API. Planilha de seis baldes mês a mês, break-even e veredito por persona.

· 10 min · Lucas Souza
Adoção segura de IA na empresa: EU AI Act + NIST RMF na prática (e o que o jurídico quer ver)
Tutoriais

Adoção segura de IA na empresa: EU AI Act + NIST RMF na prática (e o que o jurídico quer ver)

Em 2 de agosto de 2026 o EU AI Act entra na parte com dente: multa, fiscal, processo. Guia prático com os quatro níveis de risco traduzidos pra feature real, NIST AI RMF resumido, checklist técnico de 12 itens e template de AI Decision Record (AIDR) pronto pra colar no repo. Sem teoria de consultoria.

· 16 min · Lucas Souza
Google I/O 2026: 7 anúncios que mudam o trabalho do AI engineer brasileiro
Notícias

Google I/O 2026: 7 anúncios que mudam o trabalho do AI engineer brasileiro

Os sete movimentos de plataforma do Google I/O 2026 que mudam o trabalho do AI engineer brasileiro, com comparativo Gemini 3.5 Flash x Sonnet 4.5 x GPT-5.5 em três tarefas backend reais e o que ignorar do hype enterprise.

· 11 min · Lucas Souza
Quanto custa um agente em produção em 2026: planilha real depois de 6 meses
Notícias

Quanto custa um agente em produção em 2026: planilha real depois de 6 meses

A calculadora da OpenAI mente. Pricing de token é só um item de linha; a fatura real de um agente em produção tem seis baldes: inferência, eval em runtime, observability, infra, pessoas, outros. Este post abre o balancete de 6 meses, mês a mês, com números e fontes. No fim, build vs buy: quando vale construir e quando você está pagando para reinventar o Cursor.

· 15 min · Lucas Souza
Roadmap AI Engineer em 90 dias: do dev backend ao primeiro agente em produção
Tutoriais

Roadmap AI Engineer em 90 dias: do dev backend ao primeiro agente em produção

Caminho real de 13 semanas para dev backend experiente virar AI engineer aplicada. Tool use, harness próprio, RAG, memória, evals e um projeto fim-a-fim que cabe no portfólio. Sem refazer fundamentos, sem detour por framework da moda. Entregáveis por semana e foco no que recrutador olha de verdade.

· 11 min · Lucas Souza
Engenharia de IA não é Data Science: 7 diferenças que separam disciplina de hype
Notícias

Engenharia de IA não é Data Science: 7 diferenças que separam disciplina de hype

Recrutador chama as duas de "vaga de IA". CTO que confunde uma com a outra paga seis meses de retrabalho. Põe lado a lado data science e engenharia de IA em sete eixos: foco, métrica, stack, output, tempo de feedback, quem migra mais rápido e por que essa confusão atrasa carreira.

· 9 min · Lucas Souza
Engenheiro de IA em 2026: o que faz, e por que não é só usar ChatGPT no trabalho
Notícias

Engenheiro de IA em 2026: o que faz, e por que não é só usar ChatGPT no trabalho

Em 2024 era cargo inventado pelo LinkedIn. Em 2026 é o sênior mais disputado dos EUA. O que faz um Engenheiro de IA na prática: as 5 entregas em qualquer JD sênior, o stack típico (LLM API, harness, vector store, evals, observability) e por que a maioria veio de backend, não de Data Science.

· 10 min · Lucas Souza

VirguIA

beer & code assistant

conectando…

Não foi possível iniciar o chat agora.

tocando