Reins Engineering

Hurl עוצר logic drift ב-vibe coding
Vibe coding קורס ל-logic drift תוך שלושה חודשים. CMU, METR, DORA ו-Amazon הוכיחו זאת. הצהירו חוזי API ב-plain text עם Hurl ונעלו אותם עם ratchet — drift מדוכא מבנית מבלי להגביל את חופש ה-AI.

קוד Ratchet שמנצל את IFEval לטובתו
הטיית החנפנות של LLM היא לא באג — היא נכס. כשמשלבים את יכולת מילוי ההוראות שנמדדת ב-IFEval עם משוב דטרמיניסטי, גם מודל מקומי של 4.5B מייצר קוד מדויק בלולאת התכנסות.

yongol — השדרה של SaaS מקודד בינה מלאכותית
Vibe coding קורס ב-200 endpoints כי AI לא יכול להבחין בין החלטות לפרטי מימוש. yongol מעביר את עבודת ה-AI מקוד ל-10 מפרטים הצהרתיים ואוכף עקביות בין שכבות לפני הקומפילציה. Harness with reins.

הטיית Sycophancy ב-AI היא פיצ'ר עסקי
הטיית sycophancy ב-LLM היא לא באג. היא תוצאה מתמטית הכרחית של RLHF, ופיצ'ר מסחרי שלחברות הטכנולוגיה הגדולות אין תמריץ לתקן. לכן LLM-as-Judge בלתי אפשרי מבחינה מבנית.

למה סוכני קידוד עובדים ולמה הם קורסים
אותו מודל שמזייף מידע בצ'אט עובד מצוין בסוכן קידוד. לא המודל השתנה — ה-topology השתנתה. היצירה יכולה להיות הסתברותית. האימות חייב להיות דטרמיניסטי.

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף
נתתי לסוכן AI לכתוב טסטים ל-527 פונקציות — הוא עצר ב-40 והכריז 'סיימתי'. Ratchet Pattern כופה את הכרעת ההשלמה על verifier מכני וגורם לסוכן להגיע באמת עד הסוף.

טופולוגיית Feedback חשובה מ-IQ של מודל
אותו מודל נתקע ב-40 או מסיים 527. ההבדל הוא לא המודל אלא מבנה ה-Feedback. הביצועים של LLM תלויים פחות במודל עצמו ויותר בשאלה עד כמה מהירה ודטרמיניסטית לולאת ה-Feedback שעליה הוא פועל.

tsma — קו ההגנה נגד רגרסיות בקוד ישן
אינדוקס של כל הפונקציות, זיהוי קיום טסטים, מדידת coverage ומשוב ל-LLM agent — כלי CLI אחד. בפקודה אחת בונים קו הגנה נגד רגרסיות בקוד ישן.

filefunc — קובץ אחד, מושג אחד
יחידת הניווט של סוכן קוד AI היא הקובץ. מוסכמת מבנה קוד ב-Go וכלי CLI שמאכפים מושג אחד לקובץ אחד.