Reins Engineering

Image: AI generated

סוס ללא מושכות

כלי קידוד AI הפכו מהירים. התחברות ב-30 שניות. תשלום ב-2 דקות. MVP נשלח בשלושה שבועות.

שלושה חודשים אחר כך, הכול קורס.

ה-AI “מסדר” את לוגיקת התשלום ומשנה חישובי הנחות. בקשת רפקטורינג משנה שמות שדות ב-API הציבורי. הוספת פיצ’ר חדש שוברת אימות. לפי מחקר של קרנגי מלון (MSR 2026), מורכבות הקוד עולה באופן קבוע ב-41% לאחר אימוץ כלי קידוד AI. דוח Google DORA Report (2025) מראה ירידה של 7.2% ביציבות ההפצה על כל עלייה של 25% באימוץ AI.

הבעיה היא לא ש-AI טיפש. הבעיה היא שאין מושכות.

רתמה היא גדר

התעשייה הגיבה עם “harness engineering”. לינטרים, פורמטרים, CI/CD, מבנה פרויקט, כללי קידוד. גדרות שמונעות מהסוכן לצאת החוצה.

גדרות לא קובעות כיוון. מה שהסוכן לא יעשה בתוך הגדר — יחליף לוגיקה קיימת, ישנה טיפוסים, ידלג על מעברי מצב — הלינטר עובר. הפורמטר עובר. CI עובר. קוד מגיע לפרודקשן “נקי אבל שגוי”.

האוכף מורכב. הרוכב עלה. אבל בלי מושכות, הוא נאחז בירכיים ונופל אחרי שלושה חודשים.

Reins Engineering

Reins Engineering הוא גישה הנדסית שנותנת לסוכני AI חוזים דטרמיניסטיים וחוסמת התקדמות כשחוזים מופרים.

הוא מורכב משלושה מרכיבים:

1. משוב דטרמיניסטי

תנו לסוכן עובדות, לא דעות. לא “זה נראה מוזר” אלא “שורה 41: אי-התאמה בשם שדה, צפוי ‘user_id’, התקבל ‘userId’.” משוב ללא מרחב ל-sycophancy. לפי מחקר TDAD (arxiv 2026), הוראות פרוצדורליות “עשה TDD” מחמירות רגרסיות (6.08% → 9.94%), בעוד שמתן קבצי בדיקה ספציפיים בהקשר מפחית רגרסיות ב-70% (6.08% → 1.82%).

2. נעילת חוזים (Ratchet Pattern)

כשאימות עובר — נעול. בדיקות Hurl מצהירות על התנהגות API בטקסט רגיל, ורצות בכל commit ב-CI. בדיקות שעברו לא ניתנות למחיקה. הסוכן יכול לשנות קוד בחופשיות, אבל לא יכול לשנות התנהגות. סחיפה מדוכאת מבנית.

3. הפרדת החלטות מיישום

שלושה דברים מעורבים בקוד — החלטות משתמש, לוגיקה עסקית, פרטי יישום — מופרדים. החלטות חיות במפרטים הצהרתיים (OpenAPI, DDL, דיאגרמות מצב). היישום נוצר בחופשיות על ידי AI. ה-AI לא יכול לטעות ולהחליף החלטות בפרטים. הישרדות ההחלטות הופכת עצמאית מגודל המודל.

אבולוציה

Prompt Engineering      → אמור נכון וזה עובד
Context Engineering     → תן הקשר טוב וזה עובד
Harness Engineering     → הכל במבנה
Reins Engineering       → כוון עם מושכות

כל שלב נולד ממגבלות הקודם. לפרומפטים לבד חסרה עקביות. הקשר לא עצר את הסוכן מלסטות. גדרות לא יכלו למנוע סחיפה בתוך ההיקף.

Reins Engineering הוא לא גדר — הוא מושכות. הוא לא מגביל את חופש הסוכן; הוא מבטיח שהסוכן מגיע ליעד.

למה מודלים גדולים יותר הם לא התשובה

“GPT-6 יתקן את הכול.”

לא יתקן. הבעיה היא לא אינטליגנציה של המודל — היא המדיום. קוד כמדיום לא מבדיל בין החלטות ליישום. כל מודל שקורא קוד רואה החלטות ופרטים מעורבים באותו טקסט.

מודל מקומי של 4.5B פרמטרים (Gemma4) עם משוב דטרמיניסטי + הקשר דוגמאות עורך SSOT ללא שגיאות. מודל frontier שעורך קוד גולמי מייצר סחיפה. ההבדל הוא מבנה, לא אינטליגנציה.

אל תחליפו מודל. הוסיפו חוזה.

ראיות

yongol הוא המימוש של Reins Engineering. הוא מאמת צולב את העקביות של 10 מפרטים הצהרתיים (SSOT) עם 287 כללים ומייצר קוד.

בנצ’מרק ZenFlow — SaaS אוטומציית זרימות עבודה רב-דייר. 32 endpoints, 14 טבלאות, 47 בקשות Hurl. 11/11 שלבים עברו. הוספת פיצ’רים לא האטה את התהליך. בדיקות קיימות מעולם לא נשברו.

בקאנד עובד נוצר בהצלחה עם מודל מקומי של 4.5B פרמטרים. עלות: $0. אופליין. Reins מגשר על הפער שגודל המודל משאיר.

רתמה ללא מושכות היא רק גדר

AI כבר חזק מספיק. מה שחסר זה כיוון.

בנו גדרות גבוהות יותר והסוכן יסחף מהר יותר בתוכן. תפסו מושכות והסוכן ירוץ ליעד.

Reins Engineering — אימות דטרמיניסטי מובנה לסוכני AI.

קישורים קשורים

References