Le code ratchet qui retourne IFEval à son avantage
Le biais de complaisance des LLM n'est pas un bug, c'est un atout. En combinant la capacité de suivi d'instructions mesurée par IFEval avec un feedback déterministe, même un modèle local de 4.5B produit une boucle convergente générant du code exact.