Reins Engineering

Reins Engineering — IA com rédeas Image: AI generated

Um cavalo sem rédeas

As ferramentas de codificação com IA ficaram rápidas. Login em 30 segundos. Pagamentos em 2 minutos. Um MVP é entregue em três semanas.

Três meses depois, desmorona.

A IA “limpa” a lógica de pagamento e altera os cálculos de desconto. Um pedido de refatoração muda os nomes dos campos da API pública. Adicionar uma nova funcionalidade quebra a autenticação. Segundo pesquisa da Carnegie Mellon (MSR 2026), a complexidade do código aumenta permanentemente 41% após a adoção de ferramentas de codificação com IA. O Google DORA Report (2025) mostra uma queda de 7,2% na estabilidade de entrega para cada 25% de aumento na adoção de IA.

O problema não é que a IA seja burra. É que não há rédeas.

Arreios são cercas

A indústria respondeu com “harness engineering”. Linters, formatadores, CI/CD, estrutura de projeto, diretrizes de codificação. Cercas que impedem o agente de sair.

Cercas não definem direção. O que quer que o agente faça dentro da cerca — sobrescrever lógica existente, mudar tipos, pular transições de estado — o linter passa. O formatador passa. O CI passa. O código chega à produção “limpo, mas errado”.

A sela está colocada. O cavaleiro está montado. Mas sem rédeas, segura-se com as coxas e cai depois de três meses.

Reins Engineering é uma abordagem de engenharia que fornece aos agentes de IA contratos determinísticos e bloqueia o progresso quando os contratos são violados.

Consiste em três elementos:

1. Feedback determinístico

Dê ao agente fatos, não opiniões. Não “isso parece estranho”, mas “linha 41: nome do campo não corresponde, esperado ‘user_id’, obtido ‘userId’.” Feedback sem espaço para bajulação. Segundo o estudo TDAD (arxiv 2026), instruções procedimentais de “faça TDD” pioram as regressões (6,08% → 9,94%), enquanto fornecer arquivos de teste específicos no contexto reduz as regressões em 70% (6,08% → 1,82%).

2. Travamento de contratos (Ratchet Pattern)

Quando a verificação passa, trave. Testes Hurl declaram o comportamento da API em texto simples, executando a cada commit no CI. Testes aprovados não podem ser deletados. O agente pode mudar o código livremente, mas não pode mudar o comportamento. O desvio é suprimido estruturalmente.

3. Separar decisões de implementação

Três coisas misturadas no código — decisões do usuário, lógica de negócio, detalhes de implementação — são separadas. Decisões vivem em especificações declarativas (OpenAPI, DDL, diagramas de estado). A implementação é gerada livremente pela IA. A IA não pode confundir decisões com detalhes e sobrescrevê-las. A sobrevivência das decisões se torna independente do tamanho do modelo.

Evolução

Prompt Engineering      → Say it well and it works
Context Engineering     → Give good context and it works
Harness Engineering     → Contain it with structure
Reins Engineering       → Steer it with direction

Cada estágio nasceu das limitações do anterior. Prompts sozinhos careciam de consistência. Contexto não impedia o agente de sair do controle. Cercas não conseguiam prevenir o desvio dentro do perímetro.

Reins Engineering não é uma cerca — são rédeas. Não restringe a liberdade do agente; garante que o agente chegue ao destino.

Por que modelos maiores não são a resposta

“O GPT-6 vai resolver.”

Não vai. O problema não é a inteligência do modelo — é o meio. Código como meio não distingue decisões de implementação. Qualquer modelo lendo código vê decisões e detalhes misturados no mesmo texto.

Um modelo local de 4.5B (Gemma4) com feedback determinístico + contexto de exemplo edita SSOTs até zero erros. Um modelo de fronteira editando código bruto produz desvio. A diferença é estrutura, não inteligência.

Não mude o modelo. Adicione um contrato.

Evidência

yongol é a implementação do Reins Engineering. Valida cruzadamente a consistência de 10 especificações declarativas (SSOTs) com 287 regras e gera código.

Benchmark ZenFlow — um SaaS de automação de fluxos de trabalho multi-tenant. 32 endpoints, 14 tabelas, 47 requisições Hurl. 11/11 estágios aprovados. Adicionar funcionalidades não desacelerou. Testes existentes nunca falharam.

Um backend funcional foi gerado com sucesso usando um modelo local de 4.5B. Custo $0. Offline. As rédeas preenchem a lacuna que o tamanho do modelo deixa.

Um arreio sem rédeas é apenas uma cerca

A IA já é poderosa o suficiente. O que falta é direção.

Construa cercas mais altas e o agente desvia mais rápido dentro delas. Segure as rédeas e o agente corre para o destino.

Reins Engineering — validação determinística estruturada para agentes de IA.

yongol — A quilha do AI Coding SaaS — A implementação do Reins Engineering.
Hurl para a deriva do Vibe Coding — Hurl + ratchet trava o comportamento da API.
Ratchet Pattern — A teoria por trás da verificação determinística e travamento com catraca.
IFEval-Exploiting Ratchet Code — Loops de feedback usando viés de bajulação.

References

Cursino, D. et al. (2026). “Speed at the Cost of Quality? The Impact of AI Coding on Software.” MSR 2026. arxiv.org/abs/2511.04427
Google Cloud (2025). DORA Report 2025. cloud.google.com
Wang, Z. et al. (2026). “TDAD: Test-Driven Agentic Development.” ACM AIWare 2026. arxiv.org/abs/2603.17973
Karpathy, A. (2026). “From Vibe Coding to Agentic Engineering.” thenewstack.io

Um cavalo sem rédeas

Arreios são cercas