Reins Engineering

Was ist ein 'Turn' in reins?

Eine Anatomie des Turns, der kleinsten Ausführungseinheit in reins. Was nicht aufgezeichnet ist, ist kein Turn — aus dieser einen Definition folgen Treiberunabhängigkeit, Neustart-Resilienz und Auditierbarkeit. Im Vergleich mit dem Loop-Engineering-Diskurs vom Juni 2026 zeigt sich, wie der Turn dessen Empfehlungen in Struktur verwandelt.

2026-07-07

Systeme lassen Genies heller strahlen

Ein Genie ohne Struktur treibt ab, Struktur allein bleibt mittelmäßig. Erst wenn Genie und Struktur multipliziert werden, entfalten sie ihren wahren Wert. Der ZenFlow-Benchmark (Claude Sonnet, 32 Endpunkte, 43 Minuten) und historische Belege durch die B-17, Toyota und WHO-Checklisten beweisen dasselbe Prinzip.

2026-06-25

abloq — ein agentenbetriebener Blog, dessen Verifikation die Maschine sperrt

Übergibt man einem Agenten einen Blog, kommen Texte heraus. Das Problem ist, dass man ihnen nicht trauen kann — er erfindet Quellen, hebt den lastmod eines gar nicht geänderten Textes an und fasst Dateien an, die er nicht anfassen sollte. Will der Mensch ohnehin alles prüfen, war die Übergabe sinnlos. abloqs Antwort ist die Arbeitsteilung: Erzeugung probabilistisch, Verifikation deterministisch. Der Mensch schreibt nur ein einziges Blatt — die Insight-Spezifikation (insight.yaml); Erstellung, Übersetzung, Auffrischung und Belegverstärkung übernimmt der Agent als Quest, und die Qualität verbürgt ein aus einem einzigen blog.yaml abgeleitetes deterministisches Gate. Ein gesperrtes PASS ist irreversibel — der Agent mag wegwerfbar sein, doch der Fortschritt akkumuliert.

2026-06-11

Warum deine Agenten-Loop divergiert

Je verbreiteter Loop Engineering wird, desto öfter stoßen Menschen an dieselbe Wand — die Loop konvergiert nicht, sie divergiert. Endlose Rotation, Drift, Reward Hacking: Die drei Gesichter haben eine gemeinsame Wurzel. Man hat den Generator selbst wieder in den Urteilsslot der Loop gesteckt. Doch Divergenz ist noch Glück. Denn sie ist sichtbar. Wirklich gefährlich ist die Loop, die still falsch konvergiert. Es gibt nur ein Rezept — die Befugnis, den Abschluss zu verriegeln, gehört nicht dem LLM, sondern allein einem deterministischen Gate.

2026-06-11

Der Produktionsverkehr ist die Spezifikation

Legacy-Code hat keine Dokumentation. Auch keine Tests. Und doch läuft er gerade jetzt. Ein Monat gut geführter Logs ist bereits die Spezifikation — wer aus dem Produktionsverkehr Hurl-Integrationstests baut, die das aktuelle Verhalten einfangen, fixiert die Funktionen des Legacy-Systems und spannt ein Sicherheitsnetz fürs Refactoring, ohne eine einzige Zeile Code zu lesen.

2026-06-06

Eine ganze Stadt verbrennen für eine einzige Antwort

Ein Modell mit einer Billion Parametern verbrennt so viel Strom und Wasser wie eine ganze Stadt, nur um eine einzige Antwort auszuspucken. Ich hielt das für Wahnsinn. Auf der Suche nach einer Antwort erkannte ich: Genau der Fehler, den alle beheben wollten, die Schmeichelei der LLMs, war die Antwort. Füttert man sie mit fact, wird aus Schmeichelei Genauigkeit. Dieser Text erzählt, warum ich Reins begonnen habe.

2026-06-06

reins — nur die Domain aus der Quest-CLI behalten, das ratchet als Framework

how-make-quest lehrte, wie man eine Quest-CLI mit bloßen Händen baut. Doch baut man eine zweite CLI, schreibt man dasselbe ratchet, dasselbe scan/next/submit, dieselbe Aggregation erneut. reins extrahiert dieses Invariante als Framework — ratchet, Befehlsgerüst, Aggregation und export liefert reins, du implementierst nur das Gate deiner Domain (gate.Definition, 4 Methoden). Das Gate ist ein Katalog von cheese-Abwehrregeln, und der toulmin-defeat-Graph gibt dem Agenten einen Lösungsweg zurück: 'warum verloren und was ändern, um zu gewinnen'.

2026-06-05

Das Werkzeug, das uns die Zügel reichen sollte, hatte selbst keine — Die Grenze zwischen Geschirr und Reins

"Reins Engineering — ist das nicht letztlich harness engineering?" Beide stehen nicht im Widerspruch zueinander — sie sind verschiedene Teile desselben Geschirrs. Aber verschiedene Teile. Selbst der weltweit führende Coding-Agent hatte für seinen eigenen Code keine Zügel. Denn Zügel sind nichts, was man hat — sie sind etwas, das man anlegt.

2026-06-04

Wie man eine Quest-CLI baut — ein Werkzeug bauen, das die Maschine über die Fertigstellung entscheiden lässt

Die KI sagt 'Ich bin fertig.' In Wirklichkeit ist sie es nicht. Dieser Text zeigt, wie man das Werkzeug baut, das dieses Problem löst — eine Quest-CLI. Vom Prinzip (warum) bis zum cobra-Befehlsgerüst (wie) versetzt dieser eine Text einen Agenten in die Lage, eine Go-Quest-CLI zu bauen. huma ist das durchgearbeitete Beispiel.

2026-06-03

Die Voraussetzungen für eine höhere Genauigkeit von LLM-Multi-Agenten

Mehrere Agenten parallel laufen lassen macht genauer? Nur zur Hälfte wahr. Modelle, die auf denselben Daten trainiert wurden, irren an denselben Stellen. Multi-Agenten funktionieren unter zwei Bedingungen — entweder man entwirft Fehlerunabhängigkeit, oder man stellt in einer verifizierbaren Domäne einen verifier außerhalb des LLM auf.

2026-06-02

Warum Ihr Agent niemals aufhört

Angesichts des Prahlens, einen Agenten rund um die Uhr laufen zu lassen, stellt sich nicht Bewunderung ein, sondern eine Frage – warum ist er noch nicht fertig? Code ist kein Suchproblem, sondern ein Constraint-Satisfaction-Problem. Ein System, das anhalten kann, ist ein gesundes System.

2026-06-01

Über die Schönheit

70 % des Schönen ist Mathematik. Die Maschine sperrt die Ordnung deterministisch ein, und nur die 30 % Komplexität entscheidet der Mensch. Reins Engineering ist kein KI-Coding-Werkzeug — es ist das Prinzip, die Ordnung einzusperren und nur die Komplexität dem Menschen zu überlassen.

2026-05-31

Wer definiert »Abgeschlossen«? — Das Problem, das Spiele 40 Jahre früher gelöst haben

In dem Moment, wo man den Auszug eines Mieters mit fünf Fotos definiert, wird es zum Spiel-Quest. »Abgeschlossen« nicht als Behauptung des Ausführenden, sondern als maschinell verifizierbaren Zustand zu definieren — das haben Spiele 40 Jahre früher gelöst, und es ist die richtige Art, KI-Agenten Arbeit zu geben.

2026-05-30

Lektion 11. Gescheiterten Vibe-Code retten

Die mit Vibe Coding gebaute App ist abgestürzt. Kein Neubau nötig. Diagnostizieren, sperren, und Schritt für Schritt herausfinden.

2026-05-28

Supabase ist die Falle des Vibe Codings

Der Grund, warum KI Supabase empfiehlt, ist nicht technische Überlegenheit, sondern die Fülle an Tutorials in den Trainingsdaten. Wenn Geschäftslogik in eine Black Box wandert, kann der Agent sie nicht mehr nachverfolgen. Der Einstieg dauert 30 Sekunden, der Ausstieg 3 Monate.

2026-05-28

Agent-operable Systeme bauen

60 bis 80 % der IT-Budgets der Fortune 500 fliessen in die Bewachung gesperrter Legacy-Systeme. Weil man sie nicht oeffnen kann. Die eigentliche Bedeutung der KI-Blase ist nicht, dass Modelle intelligenter werden — sondern dass die gesperrte Unternehmensmemory erreichbar wird.

2026-05-27

huma -- Eine Ratsche die keinen Endpoint auslasst

Wenn Sie einen KI-Agenten bitten 42 Endpoints zu testen erklaert er um den 15. herum fertig. huma verwandelt die Endpoint-Liste in eine Ratschen-Sitzung sodass der Agent keinen einzigen auslassen kann. scan next write verify.

2026-05-26

codistill -- SSOT aus bestehendem Code herauspressen

Muss man mit SSOT von Null anfangen um yongol zu nutzen? Nein. codistill extrahiert automatisch OpenAPI DDL und sqlc-Abfragen aus bestehendem Code über 16 Web-Frameworks in 8 Sprachen.

2026-05-26

Agent Operable Codebase

Ist Code, der für Menschen gut lesbar ist, derselbe wie Code, mit dem Agenten gut arbeiten können? Nein. Wenn eine Datei 20 Funktionen hat, sinkt die Agent-Leistung um 30-85%. Das Büro muss zur Fabrik werden.

2026-05-25

Lektion 10. Das Gesetz der Daten — Agent Operable Data

Wenn Code falsch ist, fangen Tests es. Wenn Daten falsch sind, weiß niemand Bescheid. Das Schema ist das Gesetz das ich aufstelle.

2026-05-24

Lektion 9. Automatisierung jenseits des Codes — Agent Operable System

Reicht es, wenn nur der Code agent-operable ist? Eine Struktur in der Agenten Build, Deployment und Monitoring betreiben.

2026-05-24

Lektion 8. Die Fabrik des Agenten — Agent Operable Codebase

20 Funktionen in einer Datei, Agentenleistung sinkt 30-85%. Aufteilen mit filefunc, testen mit tsma.

2026-05-24

Lektion 7. Schmeichelei umkehren — Balance zwischen Prompts und Verifikatoren

Gib Meinungen und sie schmeichelt. Gib Fakten und sie korrigiert.

2026-05-24

Lektion 6. Bestanden dann gesperrt — Ratchet Pattern Prinzipien und Massenanwendung

KI erklärte fertig zu sein. Tatsächlich 40/527. Das Ratchet Pattern übergibt die Abschlussbeurteilung an die Maschine.

2026-05-24

Lektion 5. KI mit Zügeln — Einführung in Reins Engineering

Harness Engineering ist ein Zaun. Reins Engineering sind die Zügel. Ändere nicht das Modell, füge Verträge hinzu.

2026-05-24

Lektion 4. Entscheidungen außerhalb des Codes — yongol und deklarative Full-Stack-Kontrolle

KI kann Entscheidungen nicht von Implementierungsdetails unterscheiden. yongol trennt Entscheidungen in 10 deklarative Spezifikationen.

2026-05-24

Lektion 3. Apps die nicht brechen — Hurl, Git, CI/CD

Deklariere API-Verträge mit Hurl, erstelle Speicherpunkte mit Git, automatisiere Verifikation mit CI/CD.

2026-05-24

Lektion 2. Wie man KI nicht vertraut — Grenzen und Ursachen des Vibe Codings

Drift, bei dem KI bestehende Funktionen still verändert beim Hinzufügen neuer, 58% Schmeichelei-Bias.

2026-05-24

Lektion 1. Wie man KI anleitet — Grundlagen des Vibe Codings

Von der Installation von Claude Code bis zum Kontextmanagement mit CLAUDE.md. Wie jemand ohne Programmierkenntnisse KI anleiten kann.

2026-05-24

Lektion 0. Claude Code installieren — Was du nutzt, ist vielleicht nicht Claude Code

Die Haelfte dessen, was YouTube 'Claude Code' nennt, ist kein Claude Code. Selbst das gleiche Modell liefert andere Ergebnisse, wenn der Agent ein anderer ist. Hier beginnt der Kurs — und hier wird der Eingang gesichert.

2026-05-24

Reins Engineering — KI mit Zugeln

Harness Engineering ist ein Zaun. Er halt den Agenten davon ab, hinauszugehen, garantiert aber nicht, dass er das Ziel erreicht. Reins Engineering sind die Zugel — lenke mit deterministischen Vertragen, sichere mit Ratchets, trenne Entscheidungen von Implementierung.

2026-05-23

Hurl stoppt Vibe-Coding-Drift

Vibe Coding bricht innerhalb von 3 Monaten durch Logik-Drift zusammen. CMU, METR, DORA und Amazon belegen es. Deklarieren Sie API-Vertraege als Plain Text mit Hurl und sichern Sie sie mit einer Ratsche -- Drift wird strukturell unterdrueckt, ohne die Freiheit der KI einzuschraenken.

2026-05-22

Ratchet-Code, der IFEval ausnutzt

Der Schmeichelei-Bias von LLMs ist kein Fehler, sondern ein Vermoegenswert. Kombiniert man die von IFEval gemessene Faehigkeit zur Befolgung von Anweisungen mit deterministischem Feedback, erzeugt selbst ein lokales 4.5B-Modell eine Konvergenzschleife, die korrekten Code generiert.

2026-05-20

yongol — Der Kiel von KI-codiertem SaaS

Vibe Coding bricht bei 200 Endpoints zusammen, weil KI Entscheidungen nicht von Implementierungsdetails unterscheiden kann. yongol verlagert das Arbeitsziel der KI von Code auf 10 deklarative Spezifikationen und erzwingt schichtuebergreifende Konsistenz vor der Kompilierung. Harness with reins.

2026-05-18

Sycophancy bei KI ist ein Business-Feature

Sycophancy-Bias bei LLMs ist kein Bug. Es ist eine mathematische Unvermeidlichkeit von RLHF und ein kommerzielles Feature, das Big Tech keinen Anreiz hat zu beheben. Deshalb ist LLM-as-Judge strukturell unmöglich.

2026-05-18

Warum Coding-Agenten funktionieren und warum sie scheitern

Dasselbe Modell halluziniert im Web-Chat, liefert aber ein 200-Zeilen-Feature im Coding-Agenten. Nicht weil sich das Modell geändert hat — weil sich die Topologie geändert hat. Generierung kann probabilistisch sein. Verifikation muss deterministisch sein.

2026-05-16

Ratchet Pattern — Wie man einen Agenten dazu bringt, bis zum Ende durchzuhalten

Ich ließ einen KI-Agenten Tests für 527 Funktionen schreiben — er hörte bei 40 auf und erklärte sich fertig. Ratchet Pattern erzwingt die Fertigstellungsprüfung durch einen maschinellen verifier und bringt den Agenten dazu, wirklich bis zum Ende durchzuhalten.

2026-05-15

Feedback-Topologie statt Modell-IQ

Dasselbe Modell bleibt bei 40 stehen oder schafft alle 527. Der Unterschied ist nicht das Modell — sondern die Feedback-Struktur. Die Leistung von LLMs hängt weit mehr davon ab, wie schnell und deterministisch die Feedback-Schleife ist, als vom Modell selbst.

2026-05-14

tsma -- Die Verteidigungslinie gegen Regressionen in Legacy-Code

Alle Funktionen indexieren, Teststatus erkennen, Coverage messen und dem LLM-Agenten Feedback geben -- ein CLI-Tool. Mit einem einzigen Befehl eine Verteidigungslinie gegen Regressionen in Legacy-Code errichten.

2026-05-14

filefunc — eine Datei, ein Konzept

Die Navigationseinheit eines KI-Code-Agenten ist die Datei. Eine Codestruktur-Konvention und ein CLI-Tool, das erzwingt: eine Datei, ein Konzept.

2026-03-16