IFEval

Ratchet-код, использующий IFEval в обратную сторону

Ratchet-код, использующий IFEval в обратную сторону

Sycophancy-смещение LLM — не баг, а актив. Если способность следовать инструкциям, которую измеряет IFEval, соединить с детерминированной обратной связью, даже локальная модель на 4.5B параметров создаёт сходящийся цикл генерации точного кода.