Image: AI generated
Um cavalo sem rédeas
As ferramentas de codificação com IA ficaram rápidas. Login em 30 segundos. Pagamentos em 2 minutos. Um MVP é entregue em três semanas.
Três meses depois, desmorona.
A IA “limpa” a lógica de pagamento e altera os cálculos de desconto. Um pedido de refatoração muda os nomes dos campos da API pública. Adicionar uma nova funcionalidade quebra a autenticação. Segundo pesquisa da Carnegie Mellon (MSR 2026), a complexidade do código aumenta permanentemente 41% após a adoção de ferramentas de codificação com IA. O Google DORA Report (2025) mostra uma queda de 7,2% na estabilidade de entrega para cada 25% de aumento na adoção de IA.
O problema não é que a IA seja burra. É que não há rédeas.
Arreios são cercas
A indústria respondeu com “harness engineering”. Linters, formatadores, CI/CD, estrutura de projeto, diretrizes de codificação. Cercas que impedem o agente de sair.
Cercas não definem direção. O que quer que o agente faça dentro da cerca — sobrescrever lógica existente, mudar tipos, pular transições de estado — o linter passa. O formatador passa. O CI passa. O código chega à produção “limpo, mas errado”.
A sela está colocada. O cavaleiro está montado. Mas sem rédeas, segura-se com as coxas e cai depois de três meses.
Reins Engineering
Reins Engineering é uma abordagem de engenharia que fornece aos agentes de IA contratos determinísticos e bloqueia o progresso quando os contratos são violados.
Consiste em três elementos:
1. Feedback determinístico
Dê ao agente fatos, não opiniões. Não “isso parece estranho”, mas “linha 41: nome do campo não corresponde, esperado ‘user_id’, obtido ‘userId’.” Feedback sem espaço para bajulação. Segundo o estudo TDAD (arxiv 2026), instruções procedimentais de “faça TDD” pioram as regressões (6,08% → 9,94%), enquanto fornecer arquivos de teste específicos no contexto reduz as regressões em 70% (6,08% → 1,82%).
2. Travamento de contratos (Ratchet Pattern)
Quando a verificação passa, trave. Testes Hurl declaram o comportamento da API em texto simples, executando a cada commit no CI. Testes aprovados não podem ser deletados. O agente pode mudar o código livremente, mas não pode mudar o comportamento. O desvio é suprimido estruturalmente.
3. Separar decisões de implementação
Três coisas misturadas no código — decisões do usuário, lógica de negócio, detalhes de implementação — são separadas. Decisões vivem em especificações declarativas (OpenAPI, DDL, diagramas de estado). A implementação é gerada livremente pela IA. A IA não pode confundir decisões com detalhes e sobrescrevê-las. A sobrevivência das decisões se torna independente do tamanho do modelo.
Evolução
Prompt Engineering → Say it well and it works
Context Engineering → Give good context and it works
Harness Engineering → Contain it with structure
Reins Engineering → Steer it with direction
Cada estágio nasceu das limitações do anterior. Prompts sozinhos careciam de consistência. Contexto não impedia o agente de sair do controle. Cercas não conseguiam prevenir o desvio dentro do perímetro.
Reins Engineering não é uma cerca — são rédeas. Não restringe a liberdade do agente; garante que o agente chegue ao destino.
Por que modelos maiores não são a resposta
“O GPT-6 vai resolver.”
Não vai. O problema não é a inteligência do modelo — é o meio. Código como meio não distingue decisões de implementação. Qualquer modelo lendo código vê decisões e detalhes misturados no mesmo texto.
Um modelo local de 4.5B (Gemma4) com feedback determinístico + contexto de exemplo edita SSOTs até zero erros. Um modelo de fronteira editando código bruto produz desvio. A diferença é estrutura, não inteligência.
Não mude o modelo. Adicione um contrato.
Evidência
yongol é a implementação do Reins Engineering. Valida cruzadamente a consistência de 10 especificações declarativas (SSOTs) com 287 regras e gera código.
Benchmark ZenFlow — um SaaS de automação de fluxos de trabalho multi-tenant. 32 endpoints, 14 tabelas, 47 requisições Hurl. 11/11 estágios aprovados. Adicionar funcionalidades não desacelerou. Testes existentes nunca falharam.
Um backend funcional foi gerado com sucesso usando um modelo local de 4.5B. Custo $0. Offline. As rédeas preenchem a lacuna que o tamanho do modelo deixa.
Um arreio sem rédeas é apenas uma cerca
A IA já é poderosa o suficiente. O que falta é direção.
Construa cercas mais altas e o agente desvia mais rápido dentro delas. Segure as rédeas e o agente corre para o destino.
Reins Engineering — validação determinística estruturada para agentes de IA.
Related
- yongol — A quilha do AI Coding SaaS — A implementação do Reins Engineering.
- Hurl para a deriva do Vibe Coding — Hurl + ratchet trava o comportamento da API.
- Ratchet Pattern — A teoria por trás da verificação determinística e travamento com catraca.
- IFEval-Exploiting Ratchet Code — Loops de feedback usando viés de bajulação.
References
- Cursino, D. et al. (2026). “Speed at the Cost of Quality? The Impact of AI Coding on Software.” MSR 2026. arxiv.org/abs/2511.04427
- Google Cloud (2025). DORA Report 2025. cloud.google.com
- Wang, Z. et al. (2026). “TDAD: Test-Driven Agentic Development.” ACM AIWare 2026. arxiv.org/abs/2603.17973
- Karpathy, A. (2026). “From Vibe Coding to Agentic Engineering.” thenewstack.io