שיעור 6

טיפים מעשיים — זה כל מה שצריך

ליבת ה-ratchet במשפט אחד: בכל הוספת תכונה, hurl –test חייב לעבור כדי להמשיך. זה ה-ratchet.

“סיימתי!” — אל תאמינו. ה-AI אופטימי. 527 פונקציות, עשה 40 ואמר “סיימתי”. בדקו במספרים — TODO הוא 0 = סיימנו.

לסוכן: “הרץ tsma next, כתוב טסט לפונקציה ב-TODO. אם הטסט עובר, עבור לפונקציה הבאה עם tsma next. חזור על זה עד ‘All functions complete!’”


למה צריך לפקד ככה

שלושה כללים

  1. מציגים פריט אחד בכל פעם. הסוכן לא יכול לדלג.
  2. חייב לעבור כדי להמשיך. אי אפשר לדלג.
  3. הכל עבר = עצור. “סיימתי” אומרת המכונה.

חמישה עקרונות

  1. תנאי סיום מכני — pass/fail.
  2. PASS הוא בלתי הפיך — מה שעבר לא נפתח שוב.
  3. LLM רק מייצר — מה לתקן, אם עבר, מה הבא, אם סיימנו → המכונה מחליטה.
  4. שוללים מהסוכן את זכות ההכרזה על סיום — 40 לעומת 527.
  5. Verifier חייב להיות דטרמיניסטי — אותו קלט = אותה תוצאה.

tsma — כלי מעשי

פקודה אחת: tsma next. מחזירה את הפונקציה הבאה בלי טסט, מודדת כיסוי, מראה ענפים לא מכוסים עם מספרי שורות.

527 פונקציות: PASS 246 (46.7%), DONE 281 (53.3%), TODO 0 (0.0%).

סוכנים מתים. התקדמות שורדת.

tsma שומר מצב ב-.tsma/session.json. סוכן חדש → tsma next → ממשיך מאיפה שהקודם עצר.


קורס Reins Engineering המלא

שיעורכותרת
שיעור 1איך לפקד על AI
שיעור 2למה אי אפשר לסמוך על AI
שיעור 3אפליקציות שלא נשברות
שיעור 4החלטות מחוץ לקוד
שיעור 5AI עם רסן
שיעור 6עבר = נעול
שיעור 7איך להפוך חנופה
שיעור 8המפעל של הסוכן
שיעור 9אוטומציה מעבר לקוד
שיעור 10חוק הנתונים

מקורות

  1. TDAD, ACM AIWare 2026 — הוראה פרוצדורלית “תעשה TDD” מחמירה רגרסיה, הקשר ספציפי מפחית 70%.