Reins Engineering

¿Qué es un 'turno' en reins?

Una anatomía del turno (turn), la unidad mínima de ejecución de reins. Lo que no está registrado no es un turno — de esta sola definición se derivan la independencia del driver, la resistencia al reinicio y la auditabilidad. Comparado con el discurso del Loop Engineering de junio de 2026, vemos cómo el turno convierte aquellas recomendaciones en estructura.

2026-07-07

Los sistemas hacen brillar más al genio

Un genio sin estructura va a la deriva, y la estructura sola es mediocre. Solo cuando genio y estructura se multiplican emerge el valor real. El benchmark ZenFlow (Claude Sonnet, 32 endpoints, 43 minutos) y la evidencia histórica del B-17, Toyota y las listas de verificación de la WHO demuestran el mismo principio.

2026-06-25

abloq — un blog operado por agentes; el dictamen lo bloquea la máquina

Si le encargas un blog a un agente, los artículos salen. El problema es que no puedes confiar en ellos — fabrica fuentes, sube el lastmod de textos que ni siquiera tocó y modifica archivos que no le pediste. Si la persona va a revisarlo todo, no tenía sentido encargarlo. La respuesta de abloq es la división del trabajo: la generación es probabilística, la verificación determinista. Lo único que escribe la persona es una hoja de especificación de insight (insight.yaml); la redacción, traducción, actualización y refuerzo de evidencia los hace el agente como quest, y la calidad la garantiza una puerta determinista derivada de una sola hoja, blog.yaml. El PASS bloqueado es irreversible — el agente puede ser desechable, pero el progreso se acumula.

2026-06-11

Por qué tu loop de agente diverge

Cuanto más se generaliza el Loop Engineering, más gente choca contra el mismo muro: el loop no converge, diverge. Giro infinito, deriva y reward hacking: las tres caras tienen una sola raíz. Volviste a enchufar al propio generador en la ranura de juicio del loop. Y la divergencia, en realidad, es tener suerte. Porque se ve. Lo que de verdad asusta es el loop que convergió en falso, en silencio. La receta es una sola: la potestad de cerrar el 'completado' no la tiene el LLM, sino únicamente un gate determinista.

2026-06-11

El tráfico de producción es la especificación

El código legacy no tiene documentación. Tampoco tiene pruebas. Y, sin embargo, ahora mismo está funcionando. Un mes de logs bien registrados es ya la especificación: si construyes pruebas de integración Hurl que capturen el comportamiento actual a partir del tráfico de producción, fijas las funciones del legacy y tiendes la red de seguridad de la refactorización sin leer una sola línea de código.

2026-06-06

Quemar una ciudad entera para obtener una sola respuesta

Un modelo de un billón de parámetros quema tanta electricidad y agua como una ciudad entera solo para escupir una respuesta. Pensé que esto era una locura. Buscando una salida, lo entendí. El defecto que todos querían corregir, la adulación del LLM, era justamente la respuesta. Si lo alimentas con fact, la adulación se convierte en precisión. Esta es la historia de por qué empecé Reins.

2026-06-06

reins — del Quest CLI solo queda el dominio; el ratchet se vuelve framework

how-make-quest enseñó a construir un Quest CLI con las manos. Pero al levantar el segundo CLI vuelves a escribir el mismo ratchet, el mismo scan/next/submit, la misma agregación. reins extrae ese invariante a un framework — el ratchet, el esqueleto de comandos, la agregación y el export los suministra reins, y tú solo implementas la puerta del dominio (los 4 métodos de gate.Definition). La puerta es un catálogo de reglas de defensa contra el cheese, y el defeat graph de toulmin le devuelve al agente una guía de 'por qué perdiste y qué cambiar para ganar'.

2026-06-05

La herramienta que prometía riendas no tenía riendas propias — la frontera entre arnés y Reins

"Reins Engineering, ¿no es al final harness engineering?" Ambos no se oponen — son piezas distintas del mismo arreo. Pero distintas. Incluso el mejor agente de código del mundo no le puso riendas a su propio código. Porque las riendas no se tienen: se aplican.

2026-06-04

Cómo crear un Quest CLI — construir tú mismo la herramienta que deja la decisión de 'terminado' en manos de la máquina

La IA dice 'ya está hecho'. En realidad no ha terminado. Este artículo enseña a construir tú mismo la herramienta que resuelve ese problema — el Quest CLI. Desde el principio (el porqué) hasta el esqueleto de comandos en cobra (el cómo), este único artículo basta para que un agente cree un Quest CLI en Go. huma es el ejemplo trabajado.

2026-06-03

Las precondiciones para mejorar la precisión de los multiagentes LLM

¿Más agentes significa más precisión? Solo la mitad es cierto. Los modelos entrenados con los mismos datos se equivocan en los mismos lugares. Los multiagentes funcionan bajo dos condiciones: diseñar la independencia de errores, o levantar un verifier fuera del LLM en un dominio verificable.

2026-06-02

Por qué tu agente nunca se detiene

Ante el alarde de tener un agente corriendo 24 horas, lo que surge no es admiración sino una duda: ¿por qué todavía no ha terminado? El código no es un problema de búsqueda, sino un problema de satisfacción de restricciones. Un sistema que puede detenerse es un sistema sano.

2026-06-01

Sobre la belleza

El 70% de lo bello es matemática. La máquina bloquea el orden de forma determinista, y solo el 30% de complejidad lo decide el ser humano. Reins Engineering no es una herramienta de codificación con IA — es el principio de bloquear el orden y dejar al ser humano solo la complejidad.

2026-05-31

¿Quién define «completado»? — Lo que los videojuegos resolvieron 40 años antes

Cuando defines la confirmación de desalojo de un inquilino como cinco fotos concretas, eso se convierte en una quest de videojuego. Definir «completado» no como la declaración del agente sino como una condición verificable mecánicamente — eso es lo que los videojuegos resolvieron 40 años antes, y es la clave para que los agentes de IA trabajen correctamente.

2026-05-30

Clase 11. Cómo rescatar una app de vibe coding que se rompió

La app que hiciste con vibe coding se rompió. No necesitas reescribirla. Diagnostícala, bloquéala y sal de ahí paso a paso.

2026-05-28

Supabase Es una Trampa del Vibe Coding

El motivo por el que la IA recomienda Supabase no es la superioridad técnica, sino que los tutoriales dominan los datos de entrenamiento. Una vez que la lógica de negocio entra en una caja negra, los agentes no pueden rastrearla. Entrar toma 30 segundos. Salir toma 3 meses.

2026-05-28

Construir sistemas operables por agentes

El 60-80% del presupuesto IT de las Fortune 500 se destina a custodiar legacy bloqueado. Porque no pueden abrirlo. El verdadero significado de la burbuja de IA no son modelos más inteligentes — es que la memoria corporativa bloqueada está volviéndose alcanzable.

2026-05-27

huma -- Un trinquete que no se salta ni un endpoint

Cuando pides a un agente AI que pruebe 42 endpoints, declara terminado alrededor del 15. huma convierte la lista de endpoints en una sesion de trinquete para que el agente no pueda saltarse ni uno. scan, next, write, verify.

2026-05-26

codistill -- Exprime el SSOT del codigo existente

Para usar yongol hay que empezar con SSOT desde cero? No. codistill extrae automaticamente OpenAPI, DDL y consultas sqlc del codigo existente en 16 frameworks web de 8 lenguajes. No es obra de cimientos, es refuerzo antisismico.

2026-05-26

Agent Operable Codebase

¿El código fácil de leer para humanos es igual al código fácil de operar para agentes? No lo es. Cuando un archivo tiene 20 funciones, el rendimiento del agente cae 30-85%. La oficina debe convertirse en fábrica.

2026-05-25

Clase 10. La ley de los datos — Agent Operable Data

Si el código está mal, los tests lo detectan. Si los datos están mal, nadie lo sabe. El schema es la ley que yo establezco.

2026-05-24

Clase 9. Automatización más allá del código — Agent Operable System

Solo código agent-operable no es suficiente. Una estructura donde los agentes operan build, despliegue y monitoreo.

2026-05-24

Clase 8. La fábrica del agente — Agent Operable Codebase

20 funciones en un archivo, rendimiento del agente cae 30-85%. Divide con filefunc, prueba con tsma.

2026-05-24

Clase 7. Invirtiendo la adulación — Balance entre prompts y verificadores

Dale opiniones y adula. Dale hechos y corrige. Cómo usar el sesgo de adulación como activo, no como defecto.

2026-05-24

Clase 6. Pasa y se bloquea — Principios y aplicación masiva del Ratchet Pattern

La IA declaró que terminó. En realidad 40/527. El Ratchet Pattern delega el juicio de finalización a la máquina.

2026-05-24

Clase 5. IA con riendas — Introducción a Reins Engineering

La ingeniería de arnés es una cerca. Reins Engineering son las riendas. No cambies el modelo, agrega contratos.

2026-05-24

Clase 4. Decisiones fuera del código — yongol y control declarativo full-stack

La IA no puede distinguir las decisiones de los detalles de implementación mezclados en el código. yongol separa las decisiones en 10 especificaciones declarativas, detectando contradicciones entre capas con 287 reglas.

2026-05-24

Clase 3. Apps que no se rompen — Hurl, Git, CI/CD

Declara contratos de API con Hurl, crea puntos de guardado con Git, automatiza la verificación con CI/CD. Cuando los tres se combinan, se convierten en un trinquete.

2026-05-24

Clase 2. Cómo no confiar en la IA — Límites y causas del Vibe Coding

El drift donde la IA altera silenciosamente funciones existentes al agregar nuevas, sesgo de adulación del 58%, la matemática donde 97% multiplicado 5 veces da 86%. Por qué colapsa en 5 funciones.

2026-05-24

Clase 1. Cómo dirigir la IA — Fundamentos del Vibe Coding

Desde instalar Claude Code hasta gestionar contexto con CLAUDE.md. Cómo alguien que no sabe programar puede dirigir la IA.

2026-05-24

Clase 0. Instalar Claude Code — Puede que lo que usas no sea Claude Code

La mitad de lo que YouTube llama 'Claude Code' no es Claude Code. Aunque sea el mismo modelo, si el agente es distinto, el resultado es distinto. Aquí cerramos la puerta de entrada del curso.

2026-05-24

Reins Engineering — IA con riendas

Harness engineering es una valla. Evita que el agente se salga, pero no garantiza que llegue al destino. Reins Engineering son las riendas: dirigir con contratos deterministas, bloquear con trinquetes, separar decisiones de implementacion.

2026-05-23

Hurl detiene la deriva del vibe coding

El vibe coding colapsa por deriva logica en 3 meses. CMU, METR, DORA y Amazon lo demuestran. Declara contratos de API en texto plano con Hurl y bloquealos con un trinquete: se suprime la deriva estructuralmente sin limitar la libertad de la IA.

2026-05-22

Código trinquete que aprovecha IFEval

El sesgo de adulación de los LLM no es un defecto, es un activo. Al combinar la capacidad de seguir instrucciones que mide IFEval con retroalimentación determinista, incluso un modelo local de 4.5B genera un bucle de convergencia que produce código correcto.

2026-05-20

yongol — La quilla del SaaS programado con IA

El vibe coding colapsa en 200 endpoints porque la IA no puede distinguir decisiones de detalles de implementación. yongol traslada el objetivo de trabajo de la IA del código a 10 especificaciones declarativas y fuerza la consistencia entre capas antes de la compilación. Harness with reins.

2026-05-18

El sesgo de adulación de la IA es una funcionalidad comercial

El sesgo de adulación de los LLM no es un bug. Es una inevitabilidad matemática del RLHF y una funcionalidad comercial que las big tech no tienen incentivo para corregir. Por esto LLM-as-Judge es estructuralmente imposible.

2026-05-18

Por qué los agentes de código funcionan y por qué colapsan

El mismo modelo alucina en el chat web pero entrega una función de 200 líneas en un agente de código. No porque el modelo cambió — porque la topología cambió. La generación puede ser probabilística. La verificación debe ser determinista.

2026-05-16

Ratchet Pattern — Cómo hacer que un agente termine el trabajo

Le pedí a un agente de IA que escribiera tests para 527 funciones. Se detuvo en 40 y declaró 'listo'. El Ratchet Pattern fuerza la finalización delegando la decisión de completitud a un verifier mecánico, para que el agente siga hasta que la máquina diga basta.

2026-05-15

La topología del feedback importa más que el IQ del modelo

El mismo modelo se detiene en 40 o completa los 527. La diferencia no es el modelo, sino la estructura de retroalimentación. El rendimiento del LLM depende mucho más de lo rápido y determinista que sea el bucle de retroalimentación que del modelo en sí.

2026-05-14

tsma -- Linea de defensa contra regresiones en codigo legado

Una herramienta CLI que indexa todas las funciones, detecta la existencia de pruebas, mide la cobertura y proporciona retroalimentacion precisa a agentes LLM. Un solo comando construye una linea de defensa contra regresiones en codigo legado.

2026-05-14

filefunc — Un archivo, un concepto

La unidad de navegacion de un agente de codigo IA es el archivo. filefunc es una convencion de estructura de codigo Go y herramienta CLI que impone un concepto por archivo.

2026-03-16