LLM

Die Voraussetzungen für eine höhere Genauigkeit von LLM-Multi-Agenten

Mehrere Agenten parallel laufen lassen macht genauer? Nur zur Hälfte wahr. Modelle, die auf denselben Daten trainiert wurden, irren an denselben Stellen. Multi-Agenten funktionieren unter zwei Bedingungen — entweder man entwirft Fehlerunabhängigkeit, oder man stellt in einer verifizierbaren Domäne einen verifier außerhalb des LLM auf.

2026-06-02

Ratchet-Code, der IFEval ausnutzt

Der Schmeichelei-Bias von LLMs ist kein Fehler, sondern ein Vermoegenswert. Kombiniert man die von IFEval gemessene Faehigkeit zur Befolgung von Anweisungen mit deterministischem Feedback, erzeugt selbst ein lokales 4.5B-Modell eine Konvergenzschleife, die korrekten Code generiert.

2026-05-20

Sycophancy bei KI ist ein Business-Feature

Sycophancy-Bias bei LLMs ist kein Bug. Es ist eine mathematische Unvermeidlichkeit von RLHF und ein kommerzielles Feature, das Big Tech keinen Anreiz hat zu beheben. Deshalb ist LLM-as-Judge strukturell unmöglich.

2026-05-18

Warum Coding-Agenten funktionieren und warum sie scheitern

Dasselbe Modell halluziniert im Web-Chat, liefert aber ein 200-Zeilen-Feature im Coding-Agenten. Nicht weil sich das Modell geändert hat — weil sich die Topologie geändert hat. Generierung kann probabilistisch sein. Verifikation muss deterministisch sein.

2026-05-16

Feedback-Topologie statt Modell-IQ

Dasselbe Modell bleibt bei 40 stehen oder schafft alle 527. Der Unterschied ist nicht das Modell — sondern die Feedback-Struktur. Die Leistung von LLMs hängt weit mehr davon ab, wie schnell und deterministisch die Feedback-Schleife ist, als vom Modell selbst.

2026-05-14

tsma -- Die Verteidigungslinie gegen Regressionen in Legacy-Code

Alle Funktionen indexieren, Teststatus erkennen, Coverage messen und dem LLM-Agenten Feedback geben -- ein CLI-Tool. Mit einem einzigen Befehl eine Verteidigungslinie gegen Regressionen in Legacy-Code errichten.

2026-05-14

Einschränkungen sind Verträge

Ohne Versprechen herrscht Chaos, zu viele Versprechen bedeuten Unterdrückung. Rationale Einschränkungen bilden das goldene Verhältnis. Das Prinzip der Rechtsstaatlichkeit gilt für Code und Wissen gleichermaßen.

2026-03-17

filefunc — eine Datei, ein Konzept

Die Navigationseinheit eines KI-Code-Agenten ist die Datei. Eine Codestruktur-Konvention und ein CLI-Tool, das erzwingt: eine Datei, ein Konzept.

2026-03-16