Reins Engineering

Qu'est-ce qu'un « turn » dans reins ?

Une anatomie du turn, la plus petite unité d'exécution de reins. Ce qui n'est pas enregistré n'est pas un turn — de cette seule définition découlent l'indépendance du driver, la résilience au redémarrage et l'auditabilité. Comparé au discours du Loop Engineering de juin 2026, on voit comment le turn convertit ces recommandations en structure.

2026-07-07

Les systèmes font briller le génie

Un génie sans structure dérive, et une structure seule reste médiocre. Ce n'est que quand génie et structure se multiplient que la vraie valeur émerge. Le benchmark ZenFlow (Claude Sonnet, 32 endpoints, 43 minutes) et les preuves historiques du B-17, de Toyota et des checklists de l'OMS illustrent tous le même principe.

2026-06-25

abloq — un blog opéré par des agents, dont la machine verrouille la vérification

Confiez un blog à un agent et l'article sort. Le problème, c'est qu'on ne peut pas s'y fier — il fabrique des sources, relève le lastmod d'un article qu'il n'a même pas modifié, touche à des fichiers qu'on ne lui a pas demandés. Si l'humain doit tout relire, l'avoir délégué n'avait aucun sens. La réponse d'abloq, c'est la division du travail : la génération est probabiliste, la vérification est déterministe. L'humain n'écrit qu'une seule chose, une spécification d'insight (insight.yaml) ; la rédaction, la traduction, l'actualisation et le renforcement des preuves sont assurés par l'agent sous forme de quêtes ; et la qualité est garantie par une porte déterministe dérivée d'un unique blog.yaml. Un PASS verrouillé est irréversible — l'agent est jetable, mais la progression s'accumule.

2026-06-11

Pourquoi votre boucle d'agent diverge

Plus le Loop Engineering se généralise, plus les gens butent sur le même mur — la boucle ne converge pas, elle diverge. Rotation infinie, dérive, reward hacking : ces trois visages ont une seule racine. On a rebranché le générateur lui-même dans le slot de jugement de la boucle. Or, diverger, c'est encore avoir de la chance. Parce qu'on le voit. Le vrai cauchemar, c'est la boucle qui a faussement convergé en silence. L'ordonnance est unique — ne confier le pouvoir de verrouiller l'achèvement qu'à une porte déterministe, jamais au LLM.

2026-06-11

Le trafic de production est la spécification

Le code legacy n'a pas de documentation. Pas de tests non plus. Et pourtant il tourne en ce moment même. Un mois de logs bien tenus est déjà une spécification — créez des tests d'intégration Hurl qui capturent le comportement actuel à partir du trafic de production, et vous figez les fonctionnalités du legacy et posez un filet de sécurité pour la refactorisation, sans lire une seule ligne de code.

2026-06-06

Brûler une ville entière pour obtenir une seule réponse

Un modèle de mille milliards de paramètres brûle autant d'électricité et d'eau qu'une ville entière pour cracher une seule réponse. J'ai trouvé ça insensé. À force de chercher une réponse, j'ai compris. Le défaut que tout le monde voulait corriger, la flagornerie du LLM, était justement la réponse. Nourrissez-le de fact et la flagornerie devient de la précision. Ce texte raconte pourquoi j'ai lancé Reins.

2026-06-06

reins — ne garder du Quest CLI que le domaine, le ratchet devient un framework

how-make-quest enseignait à bâtir un Quest CLI à mains nues. Mais dès le deuxième CLI, on réécrit le même ratchet, les mêmes scan/next/submit, la même agrégation. reins extrait cet invariant en framework — le ratchet, le squelette de commandes, l'agrégation et l'export sont fournis par reins, et vous n'implémentez que la porte de votre domaine (les 4 méthodes de gate.Definition). La porte est un catalogue de règles de défense anti-cheese, et le defeat graph de toulmin renvoie à l'agent un guide stratégique « pourquoi tu as perdu, et quoi changer pour gagner ».

2026-06-05

L'outil censé vous donner les rênes n'avait lui-même aucune rêne — la frontière entre harnais et Reins

"Reins Engineering, c'est finalement du harness engineering, non ?" Les deux ne s'opposent pas — ce sont des pièces différentes du même équipement équestre. Mais des pièces différentes. Même le meilleur agent de codage au monde n'a pas mis de rênes sur son propre code. Car les rênes ne s'ont pas quelque chose qu'on possède — c'est quelque chose qu'on tient.

2026-06-04

Comment créer un Quest CLI — bâtir soi-même l'outil qui laisse la machine juger de l'achèvement

L'IA dit « C'est fait ». En réalité, ce ne l'est pas. Cet article explique comment bâtir soi-même l'outil qui résout ce problème — un Quest CLI. Du principe (le pourquoi) au squelette de commandes cobra (le comment), cet article unique suffit à ce qu'un agent crée un Quest CLI en Go. huma en est l'exemple pratique.

2026-06-03

Les conditions préalables à l'amélioration de la précision des LLM multi-agents

Lancer plusieurs agents rend-il plus précis ? À moitié vrai. Des modèles entraînés sur les mêmes données se trompent aux mêmes endroits. Le multi-agent ne fonctionne qu'à deux conditions : concevoir l'indépendance des erreurs, ou, dans un domaine vérifiable, dresser un verifier en dehors du LLM.

2026-06-02

Pourquoi votre agent ne s'arrête jamais

Face à la fierté de faire tourner un agent 24 heures sur 24, le sentiment qui surgit n'est pas l'admiration mais l'interrogation — pourquoi n'a-t-il pas encore fini ? Le code n'est pas un problème de recherche, mais un problème de satisfaction de contraintes. Un système sain est un système capable de s'arrêter.

2026-06-01

De la beauté

70 % de ce qui est beau, c'est des mathématiques. La machine verrouille l'ordre de façon déterministe, et l'humain ne décide que des 30 % de complexité. Reins Engineering n'est pas un outil de codage IA — c'est le principe qui verrouille l'ordre et ne laisse à l'humain que la complexité.

2026-05-31

Qui définit l'«achèvement» ? — Ce que le jeu a résolu 40 ans avant nous

Définir la libération d'un locataire par cinq photos spécifiques, c'est en faire une quête de jeu vidéo. Définir l'«achèvement» non pas comme une affirmation de l'acteur, mais comme une condition vérifiable mécaniquement — c'est ce que le jeu a résolu 40 ans avant nous, et c'est la bonne façon de confier du travail à un agent IA.

2026-05-30

Cours 11. Sauver une application brisée par le vibe coding

L'application construite avec le vibe coding a explosé. Pas besoin de tout refaire. Diagnostiquer, verrouiller, et en sortir pas à pas.

2026-05-28

Supabase est le piège du vibe coding

Si l'IA recommande Supabase, ce n'est pas pour sa supériorité technique, mais parce que les données d'entraînement regorgent de tutoriels. Une fois la logique métier enfermée dans une boîte noire, l'agent ne peut plus la tracer. Entrer prend 30 secondes, sortir prend 3 mois.

2026-05-28

Construire des systemes operables par les agents

60 a 80 % des budgets IT du Fortune 500 servent a garder un legacy verrouille. Parce qu'on ne peut pas l'ouvrir. Le vrai sens de la bulle IA, ce n'est pas des modeles plus intelligents — c'est que la memoire d'entreprise verrouillee commence a devenir accessible.

2026-05-27

huma -- Un cliquet qui ne saute aucun endpoint

Quand vous demandez a un agent IA de tester 42 endpoints il declare avoir fini vers le 15e. huma transforme la liste des endpoints en session cliquet pour que l agent ne puisse en sauter aucun. scan next write verify.

2026-05-26

codistill -- Extraire le SSOT du code existant

Faut-il commencer par le SSOT pour utiliser yongol? Non. codistill extrait automatiquement OpenAPI DDL et requetes sqlc du code existant a travers 16 frameworks web en 8 langages.

2026-05-26

Agent Operable Codebase

Le code facile à lire pour les humains est-il le même que le code facile à opérer pour les agents ? Non. Quand un fichier a 20 fonctions, la performance de l'agent chute de 30-85%. Le bureau doit devenir une usine.

2026-05-25

Cours 10. La loi des données — Agent Operable Data

Si le code est faux, les tests le détectent. Si les données sont fausses, personne ne le sait. Le schéma est la loi que j'établis.

2026-05-24

Cours 9. L'automatisation au-delà du code — Agent Operable System

Suffit-il que seul le code soit agent-operable ? Une structure où les agents gèrent build, déploiement et monitoring.

2026-05-24

Cours 8. L'usine de l'agent — Agent Operable Codebase

20 fonctions dans un fichier, performance de l'agent chute de 30-85%. Divisez avec filefunc, testez avec tsma.

2026-05-24

Cours 7. Retourner la flatterie — L'équilibre entre prompts et vérificateurs

Donnez des opinions et elle flatte. Donnez des faits et elle corrige.

2026-05-24

Cours 6. Réussi puis verrouillé — Principes et application massive du Ratchet Pattern

L'IA a déclaré avoir terminé. En réalité 40/527. Le Ratchet Pattern confie le jugement d'achèvement à la machine.

2026-05-24

Cours 5. L'IA avec des rênes — Introduction au Reins Engineering

L'ingénierie de harnais est une clôture. Le Reins Engineering ce sont les rênes. Ne changez pas le modèle, ajoutez des contrats.

2026-05-24

Cours 4. Les décisions hors du code — yongol et le contrôle déclaratif full-stack

L'IA ne peut pas distinguer les décisions des détails d'implémentation. yongol sépare les décisions en 10 spécifications déclaratives.

2026-05-24

Cours 3. Des apps qui ne cassent pas — Hurl, Git, CI/CD

Déclarez des contrats d'API avec Hurl, créez des points de sauvegarde avec Git, automatisez la vérification avec CI/CD.

2026-05-24

Cours 2. Comment ne pas faire confiance à l'IA — Limites et causes du Vibe Coding

Le drift où l'IA modifie silencieusement les fonctionnalités existantes, biais de flatterie de 58%.

2026-05-24

Cours 1. Comment commander l'IA — Les fondamentaux du Vibe Coding

De l'installation de Claude Code à la gestion du contexte avec CLAUDE.md. Comment quelqu'un qui ne connaît pas le code peut commander l'IA.

2026-05-24

Cours 0. Installer Claude Code — Ce que vous utilisez n'est peut-être pas Claude Code

La moitié de ce que YouTube appelle « Claude Code » n'est pas Claude Code. Même modèle, agent différent, résultat différent. Ce cours ferme la porte d'entrée.

2026-05-24

Reins Engineering — L'IA avec des renes

Le harness engineering est une cloture. Il empeche l'agent de sortir, mais ne garantit pas qu'il atteigne la destination. Reins Engineering, ce sont les renes — diriger avec des contrats deterministes, verrouiller avec des cliquets, separer les decisions de l'implementation.

2026-05-23

Hurl stoppe la derive du vibe coding

Le vibe coding s'effondre sous la derive logique en 3 mois. Les cas CMU, METR, DORA et Amazon le prouvent. Declarez des contrats API en texte brut avec Hurl et verrouillez-les avec un cliquet -- supprimez la derive structurellement sans limiter la liberte de l'IA.

2026-05-22

Le code a cliquet qui retourne IFEval a son avantage

Le biais de flagornerie des LLM n'est pas un defaut mais un atout. En combinant la capacite de suivi d'instructions mesuree par IFEval avec un retour deterministe, meme un modele local de 4.5B produit une boucle de convergence generant du code correct.

2026-05-20

yongol — La quille du SaaS code par IA

Le vibe coding s'effondre a 200 endpoints parce que l'IA ne peut pas distinguer les decisions des details d'implementation. yongol deplace la cible de travail de l'IA du code vers 10 specifications declaratives et impose la coherence inter-couches avant la compilation. Harness with reins.

2026-05-18

Le biais de flagornerie de l'IA est une feature commerciale

Le biais de flagornerie des LLM n'est pas un bug. C'est une inévitabilité mathématique du RLHF et une fonctionnalité commerciale que les big tech n'ont aucun intérêt à corriger. Voici pourquoi LLM-as-Judge est structurellement impossible.

2026-05-18

Pourquoi les agents de code fonctionnent et pourquoi ils s'effondrent

Le même modèle hallucine dans le chat web mais livre une fonctionnalité de 200 lignes dans un agent de code. Pas parce que le modèle a changé — parce que la topologie a changé. La génération peut être probabiliste. La vérification doit être déterministe.

2026-05-16

Ratchet Pattern — comment forcer un agent à aller jusqu'au bout

J'ai demandé à un agent AI d'écrire les tests de 527 fonctions. Il s'est arrêté à 40 et a déclaré : 'C'est fait.' Le Ratchet Pattern confie la décision d'achèvement à un verifier mécanique, forçant l'agent à aller jusqu'au bout.

2026-05-15

La topologie du feedback prime sur le QI du modèle

Le même modèle s'arrête à 40 ou complète les 527. La différence n'est pas le modèle — c'est la structure de feedback. La performance du LLM dépend bien plus de la rapidité et du déterminisme de la boucle de feedback que du modèle lui-même.

2026-05-14

tsma -- La ligne de defense contre les regressions du code legacy

Un outil CLI qui indexe toutes les fonctions, detecte la presence de tests, mesure le coverage et fournit un feedback precis a l'agent LLM. Une seule commande pour construire une ligne de defense contre les regressions dans le code legacy.

2026-05-14

filefunc — un fichier, un concept

L'unité de navigation d'un agent de code IA, c'est le fichier. filefunc est une convention de structure et un outil CLI qui impose un seul concept par fichier dans les projets Go.

2026-03-16