Reins Engineering

Hurl stoppe le logic drift du vibe coding

Hurl stoppe le logic drift du vibe coding

Le vibe coding s'effondre en logic drift en trois mois. CMU, METR, DORA et Amazon l'ont prouve. Declarez vos contrats API en plain text avec Hurl et verrouillez-les avec un ratchet — le drift est structurellement supprime sans contraindre la liberte de l'IA.

Le code ratchet qui retourne IFEval à son avantage

Le code ratchet qui retourne IFEval à son avantage

Le biais de complaisance des LLM n'est pas un bug, c'est un atout. En combinant la capacité de suivi d'instructions mesurée par IFEval avec un feedback déterministe, même un modèle local de 4.5B produit une boucle convergente générant du code exact.

yongol — La quille du SaaS codé par IA

yongol — La quille du SaaS codé par IA

Le vibe coding s'effondre à 200 endpoints parce que l'IA ne distingue pas les décisions des détails d'implémentation. yongol déplace le travail de l'IA du code vers 10 spécifications déclaratives et impose la cohérence inter-couches avant la compilation. Harness with reins.

La sycophancy de l'IA est une feature commerciale

La sycophancy de l'IA est une feature commerciale

La sycophancy des LLM n'est pas un bug. C'est une inévitabilité mathématique du RLHF et une fonction commerciale que les Big Tech n'ont aucun intérêt à corriger. Voilà pourquoi le LLM-as-Judge est structurellement impossible.

Pourquoi les agents de code fonctionnent et pourquoi ils s'effondrent

Pourquoi les agents de code fonctionnent et pourquoi ils s'effondrent

Le meme modele hallucine dans un chat web et fonctionne dans un agent de code. Ce n'est pas le modele qui a change, c'est la topology. La generation peut etre probabiliste. La verification doit etre deterministe.

Ratchet Pattern — comment forcer un agent à aller jusqu'au bout

Ratchet Pattern — comment forcer un agent à aller jusqu'au bout

J'ai demandé à un agent AI d'écrire les tests de 527 fonctions. Il s'est arrêté à 40 et a déclaré : 'C'est fait.' Le Ratchet Pattern confie la décision d'achèvement à un verifier mécanique, forçant l'agent à aller jusqu'au bout.

La topologie du feedback prime sur le QI du modèle

La topologie du feedback prime sur le QI du modèle

Le même modèle peut s'arrêter à 40 ou achever les 527. La différence n'est pas le modèle, mais la structure du feedback. La performance d'un LLM dépend davantage de la rapidité et du déterminisme de la boucle de feedback qui l'entoure que du modèle lui-même.

tsma — la ligne de défense contre les régressions du code legacy

tsma — la ligne de défense contre les régressions du code legacy

Un outil CLI qui indexe toutes les fonctions, détecte la présence de tests, mesure le coverage et fournit un feedback précis à l'agent LLM. Une seule commande pour construire une ligne de défense contre les régressions dans le code legacy.

filefunc — un fichier, un concept

filefunc — un fichier, un concept

L'unité de navigation d'un agent de code IA, c'est le fichier. filefunc est une convention de structure et un outil CLI qui impose un seul concept par fichier dans les projets Go.