LLM

Die Voraussetzungen für eine höhere Genauigkeit von LLM-Multi-Agenten

Die Voraussetzungen für eine höhere Genauigkeit von LLM-Multi-Agenten

Mehrere Agenten parallel laufen lassen macht genauer? Nur zur Hälfte wahr. Modelle, die auf denselben Daten trainiert wurden, irren an denselben Stellen. Multi-Agenten funktionieren unter zwei Bedingungen — entweder man entwirft Fehlerunabhängigkeit, oder man stellt in einer verifizierbaren Domäne einen verifier außerhalb des LLM auf.

Ratchet-Code, der IFEval ausnutzt

Ratchet-Code, der IFEval ausnutzt

Der Schmeichelei-Bias von LLMs ist kein Fehler, sondern ein Vermoegenswert. Kombiniert man die von IFEval gemessene Faehigkeit zur Befolgung von Anweisungen mit deterministischem Feedback, erzeugt selbst ein lokales 4.5B-Modell eine Konvergenzschleife, die korrekten Code generiert.

Sycophancy bei KI ist ein Business-Feature

Sycophancy bei KI ist ein Business-Feature

Sycophancy-Bias bei LLMs ist kein Bug. Es ist eine mathematische Unvermeidlichkeit von RLHF und ein kommerzielles Feature, das Big Tech keinen Anreiz hat zu beheben. Deshalb ist LLM-as-Judge strukturell unmöglich.

Warum Coding-Agenten funktionieren und warum sie scheitern

Warum Coding-Agenten funktionieren und warum sie scheitern

Dasselbe Modell halluziniert im Web-Chat, liefert aber ein 200-Zeilen-Feature im Coding-Agenten. Nicht weil sich das Modell geändert hat — weil sich die Topologie geändert hat. Generierung kann probabilistisch sein. Verifikation muss deterministisch sein.

Feedback-Topologie statt Modell-IQ

Feedback-Topologie statt Modell-IQ

Dasselbe Modell bleibt bei 40 stehen oder schafft alle 527. Der Unterschied ist nicht das Modell — sondern die Feedback-Struktur. Die Leistung von LLMs hängt weit mehr davon ab, wie schnell und deterministisch die Feedback-Schleife ist, als vom Modell selbst.

tsma -- Die Verteidigungslinie gegen Regressionen in Legacy-Code

tsma -- Die Verteidigungslinie gegen Regressionen in Legacy-Code

Alle Funktionen indexieren, Teststatus erkennen, Coverage messen und dem LLM-Agenten Feedback geben -- ein CLI-Tool. Mit einem einzigen Befehl eine Verteidigungslinie gegen Regressionen in Legacy-Code errichten.

Einschränkungen sind Verträge

Einschränkungen sind Verträge

Ohne Versprechen herrscht Chaos, zu viele Versprechen bedeuten Unterdrückung. Rationale Einschränkungen bilden das goldene Verhältnis. Das Prinzip der Rechtsstaatlichkeit gilt für Code und Wissen gleichermaßen.

filefunc — eine Datei, ein Konzept

filefunc — eine Datei, ein Konzept

Die Navigationseinheit eines KI-Code-Agenten ist die Datei. Eine Codestruktur-Konvention und ein CLI-Tool, das erzwingt: eine Datei, ein Konzept.