Ratchet

Ratchet Code, der IFEval ausnutzt

Ratchet Code, der IFEval ausnutzt

Die Sycophancy-Tendenz von LLMs ist kein Bug, sondern ein Vorteil. Kombiniert man die von IFEval gemessene Instruction-Following-Fähigkeit mit deterministischem Feedback, entsteht eine Konvergenzschleife, in der selbst ein lokales 4.5B-Modell korrekten Code erzeugt.