Reins Engineering

Hurl detiene el Logic Drift del Vibe Coding

Hurl detiene el Logic Drift del Vibe Coding

El vibe coding colapsa en logic drift en tres meses. CMU, METR, DORA y Amazon lo demuestran. Declara contratos API en plain text con Hurl y bloquealos con un ratchet — el drift se suprime estructuralmente sin restringir la libertad del AI.

Ratchet Code que aprovecha IFEval

Ratchet Code que aprovecha IFEval

El sesgo de adulación de los LLM no es un error, es un activo. Si se combina la capacidad de seguimiento de instrucciones que mide IFEval con retroalimentación determinista, incluso un modelo local de 4.5B genera código preciso en un bucle convergente.

yongol — La quilla del SaaS codificado con IA

yongol — La quilla del SaaS codificado con IA

El vibe coding colapsa en 200 endpoints porque la IA no distingue decisiones de detalles de implementación. yongol traslada el trabajo de la IA del código a 10 especificaciones declarativas y fuerza la consistencia entre capas antes de compilar. Harness with reins.

El sesgo de adulación de la IA es una funcionalidad comercial

El sesgo de adulación de la IA es una funcionalidad comercial

La adulación de los LLM no es un bug. Es una inevitabilidad matemática del RLHF y una funcionalidad comercial que las grandes tecnológicas no tienen incentivo para corregir. Por eso LLM-as-Judge es estructuralmente imposible.

Por qué los agentes de código funcionan y por qué colapsan

Por qué los agentes de código funcionan y por qué colapsan

El mismo modelo alucina en un chat web y funciona en un agente de código. No es que el modelo sea distinto, es que la topology es distinta. La generación puede ser probabilística. La verificación debe ser determinista.

Ratchet Pattern -- Como hacer que un agente termine el trabajo

Ratchet Pattern -- Como hacer que un agente termine el trabajo

Le pedi a un agente de IA que escribiera tests para 527 funciones. Se detuvo en 40 y declaro 'listo'. El Ratchet Pattern fuerza la finalizacion delegando la decision de completitud a un verifier mecanico, para que el agente siga hasta que la maquina diga basta.

Topología de retroalimentación sobre el IQ del modelo

Topología de retroalimentación sobre el IQ del modelo

El mismo modelo se detiene en 40 o completa los 527. La diferencia no es el modelo, sino la estructura de retroalimentación. El rendimiento de un LLM depende mucho más de cuán rápido y determinista sea su bucle de retroalimentación que del modelo en sí.

tsma -- Linea de defensa contra regresiones en codigo legado

tsma -- Linea de defensa contra regresiones en codigo legado

Una herramienta CLI que indexa todas las funciones, detecta la presencia de tests, mide la cobertura y proporciona retroalimentacion precisa a agentes LLM. Un solo comando construye una linea de defensa contra regresiones en codigo legado.

filefunc — un concepto por archivo

filefunc — un concepto por archivo

La unidad de exploración de un agente de código IA es el archivo. Una convención de estructura de código Go y herramienta CLI que impone un único concepto por archivo.