Ratchet-код, использующий IFEval в обратную сторону
Sycophancy-смещение LLM — не баг, а актив. Если способность следовать инструкциям, которую измеряет IFEval, соединить с детерминированной обратной связью, даже локальная модель на 4.5B параметров создаёт сходящийся цикл генерации точного кода.