Reins Engineering

Hurl stoppt logic drift beim vibe coding
Vibe coding kollabiert innerhalb von drei Monaten in logic drift. CMU, METR, DORA und Amazon beweisen es. Deklarieren Sie API-Vertraege in plain text mit Hurl und sichern Sie sie mit einem Ratchet — drift wird strukturell unterdrueckt, ohne die Freiheit der KI einzuschraenken.

Ratchet Code, der IFEval ausnutzt
Die Sycophancy-Tendenz von LLMs ist kein Bug, sondern ein Vorteil. Kombiniert man die von IFEval gemessene Instruction-Following-Fähigkeit mit deterministischem Feedback, entsteht eine Konvergenzschleife, in der selbst ein lokales 4.5B-Modell korrekten Code erzeugt.

yongol — Der Kiel von KI-codiertem SaaS
Vibe Coding bricht bei 200 Endpoints zusammen. Weil die KI nicht zwischen Entscheidungen und Implementierung unterscheiden kann. yongol verlagert das Arbeitsziel der KI vom Code auf 10 deklarative Spezifikationen und erzwingt schichtübergreifende Konsistenz vor der Kompilierung. Harness with reins.

Sycophancy bei KI ist ein Business-Feature
Sycophancy bei LLMs ist kein Bug. Sie ist eine mathematische Konsequenz von RLHF und ein kommerzielles Feature, das Big Tech keinen Anreiz hat zu beheben. Deshalb ist LLM-as-Judge strukturell unmoeglich.

Warum Coding-Agenten funktionieren und warum sie scheitern
Dasselbe Modell halluziniert im Web-Chat und funktioniert als Coding-Agent. Nicht weil das Modell anders ist, sondern weil die Topology anders ist. Generierung darf probabilistisch sein. Verifikation muss deterministisch sein.

Ratchet Pattern — Wie man einen Agenten dazu bringt, bis zum Ende durchzuhalten
Ich ließ einen KI-Agenten Tests für 527 Funktionen schreiben — er hörte bei 40 auf und erklärte sich fertig. Ratchet Pattern erzwingt die Fertigstellungsprüfung durch einen maschinellen verifier und bringt den Agenten dazu, wirklich bis zum Ende durchzuhalten.

Feedback-Topologie statt Modell-IQ
Dasselbe Modell bleibt bei 40 stehen oder schafft 527. Der Unterschied liegt nicht im Modell, sondern in der Feedback-Struktur. Die Leistung eines LLM hängt weniger vom Modell selbst ab als davon, wie schnell und deterministisch die Feedback-Schleife ist, auf der es arbeitet.

tsma — Die Verteidigungslinie gegen Regressionen in Legacy-Code
Alle Funktionen indexieren, Teststatus erkennen, Coverage messen und dem LLM-Agenten Feedback geben — ein CLI-Tool. Mit einem einzigen Befehl eine Verteidigungslinie gegen Regressionen in Legacy-Code errichten.

filefunc — eine Datei, ein Konzept
Die Navigationseinheit eines KI-Code-Agenten ist die Datei. Eine Codestruktur-Konvention und ein CLI-Tool, das erzwingt: eine Datei, ein Konzept.