Reins Engineering

Hurl עוצר logic drift ב-vibe coding

Hurl עוצר logic drift ב-vibe coding

Vibe coding קורס ל-logic drift תוך שלושה חודשים. CMU, METR, DORA ו-Amazon הוכיחו זאת. הצהירו חוזי API ב-plain text עם Hurl ונעלו אותם עם ratchet — drift מדוכא מבנית מבלי להגביל את חופש ה-AI.

קוד Ratchet שמנצל את IFEval לטובתו

קוד Ratchet שמנצל את IFEval לטובתו

הטיית החנפנות של LLM היא לא באג — היא נכס. כשמשלבים את יכולת מילוי ההוראות שנמדדת ב-IFEval עם משוב דטרמיניסטי, גם מודל מקומי של 4.5B מייצר קוד מדויק בלולאת התכנסות.

yongol — השדרה של SaaS מקודד בינה מלאכותית

yongol — השדרה של SaaS מקודד בינה מלאכותית

Vibe coding קורס ב-200 endpoints כי AI לא יכול להבחין בין החלטות לפרטי מימוש. yongol מעביר את עבודת ה-AI מקוד ל-10 מפרטים הצהרתיים ואוכף עקביות בין שכבות לפני הקומפילציה. Harness with reins.

הטיית Sycophancy ב-AI היא פיצ'ר עסקי

הטיית Sycophancy ב-AI היא פיצ'ר עסקי

הטיית sycophancy ב-LLM היא לא באג. היא תוצאה מתמטית הכרחית של RLHF, ופיצ'ר מסחרי שלחברות הטכנולוגיה הגדולות אין תמריץ לתקן. לכן LLM-as-Judge בלתי אפשרי מבחינה מבנית.

למה סוכני קידוד עובדים ולמה הם קורסים

למה סוכני קידוד עובדים ולמה הם קורסים

אותו מודל שמזייף מידע בצ'אט עובד מצוין בסוכן קידוד. לא המודל השתנה — ה-topology השתנתה. היצירה יכולה להיות הסתברותית. האימות חייב להיות דטרמיניסטי.

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף

נתתי לסוכן AI לכתוב טסטים ל-527 פונקציות — הוא עצר ב-40 והכריז 'סיימתי'. Ratchet Pattern כופה את הכרעת ההשלמה על verifier מכני וגורם לסוכן להגיע באמת עד הסוף.

טופולוגיית Feedback חשובה מ-IQ של מודל

טופולוגיית Feedback חשובה מ-IQ של מודל

אותו מודל נתקע ב-40 או מסיים 527. ההבדל הוא לא המודל אלא מבנה ה-Feedback. הביצועים של LLM תלויים פחות במודל עצמו ויותר בשאלה עד כמה מהירה ודטרמיניסטית לולאת ה-Feedback שעליה הוא פועל.

tsma — קו ההגנה נגד רגרסיות בקוד ישן

tsma — קו ההגנה נגד רגרסיות בקוד ישן

אינדוקס של כל הפונקציות, זיהוי קיום טסטים, מדידת coverage ומשוב ל-LLM agent — כלי CLI אחד. בפקודה אחת בונים קו הגנה נגד רגרסיות בקוד ישן.

filefunc — קובץ אחד, מושג אחד

filefunc — קובץ אחד, מושג אחד

יחידת הניווט של סוכן קוד AI היא הקובץ. מוסכמת מבנה קוד ב-Go וכלי CLI שמאכפים מושג אחד לקובץ אחד.