הטיית החנפנות של מודלי שפה גדולים היא לא באג אלא נכס. שילוב יכולת מילוי הוראות שנמדדת ב-IFEval עם משוב דטרמיניסטי יוצר לולאת התכנסות שמייצרת קוד נכון, גם עם מודל מקומי של 4.5B.