Reins Engineering

מהו 'תור' (Turn) ב-reins?

ניתוח אנטומי של התור (turn), יחידת הביצוע הקטנה ביותר של reins. מה שלא נרשם אינו תור — מההגדרה האחת הזו נובעות כולן: אי-תלות בדרייבר, עמידות להפעלה מחדש ויכולת ביקורת. בהשוואה לשיח ה-Loop Engineering של יוני 2026, נראה כיצד התור הופך את ההמלצות ההן למבנה.

2026-07-07

מערכות גורמות לגאונות לזרוח יותר

גאונות ללא מבנה נסחפת, ומבנה לבדו הוא בינוני. רק כשגאונות ומבנה מוכפלים זה בזה מגיע הערך האמיתי. מדד ZenFlow (Claude Sonnet, 32 endpoints, 43 דקות) וההוכחות ההיסטוריות מ-B-17, Toyota ורשימות הבדיקה של WHO מדגימים את אותו עיקרון.

2026-06-25

abloq — בלוג שסוכן מפעיל, האימות ננעל בידי מכונה

אם תפקיד בלוג בידי סוכן, מאמרים יֵצְאוּ. הבעיה היא שאי אפשר לסמוך עליהם — הוא מזייף מקורות, מעלה את ה‑lastmod של מאמר שכלל לא תיקן, ונוגע בקבצים שלא ביקשת. אם אדם יצטרך לבדוק הכול, אין טעם להפקיד את העבודה. התשובה של abloq היא חלוקת עבודה: הייצור הסתברותי, האימות דטרמיניסטי. מה שהאדם כותב הוא דף אחד של מפרט insight (insight.yaml) בלבד, את הכתיבה·התרגום·הרענון·חיזוק הראיות הסוכן מבצע ב‑Quest, והאיכות מובטחת על ידי gate דטרמיניסטי שנגזר מדף אחד של blog.yaml. PASS נעול הוא בלתי הפיך — הסוכן עשוי להיות חד‑פעמי, אך ההתקדמות מצטברת.

2026-06-11

מדוע לולאת הסוכן שלך מתבדרת

ככל ש-Loop Engineering הופך לנפוץ, אנשים מתנגשים באותו קיר — הלולאה לא מתכנסת אלא מתבדרת. סיבוב אינסופי, סחיפה, פריצת תגמול: לשלושת הפנים יש שורש אחד. שתלת מחדש את היוצר עצמו בחריץ ההכרעה של הלולאה. אבל ההתבדרות היא דווקא מזל טוב. כי רואים אותה. מה שבאמת מפחיד היא לולאה שהתכנסה־כזב בשקט. המרשם אחד — הסמכות לנעול את ההשלמה נתונה לא ל-LLM אלא רק לשער דטרמיניסטי.

2026-06-11

תעבורת הייצור היא המפרט

לקוד מורשת אין תיעוד. אין גם בדיקות. ובכל זאת הוא רץ עכשיו. חודש של לוגים שתועדו היטב הוא כבר המפרט — אם תבנו בדיקת אינטגרציה ב-Hurl שמצלמת את ההתנהגות הנוכחית מתוך תעבורת הייצור, תוכלו לקבע את הפונקציונליות של המורשת ולפרוס רשת ביטחון לריפקטורינג בלי לקרוא שורת קוד אחת.

2026-06-06

לשרוף עיר שלמה כדי לקבל תשובה אחת

מודל בן טריליון פרמטרים שורף חשמל ומים בכמות של עיר שלמה כדי לפלוט תשובה אחת. חשבתי שזה מטורף. בעודי מחפש תשובה, הבנתי: הפגם שכולם ניסו לתקן, החנופה של ה-LLM, הוא בעצמו התשובה. אם מאכילים אותו ב-fact, החנופה הופכת לדיוק. זהו סיפור על מדוע התחלתי את Reins.

2026-06-06

reins — להשאיר רק את הדומיין מ‑Quest CLI, ולהפוך את ה‑ratchet ל‑framework

how-make-quest לימד איך לבנות Quest CLI במו ידיך. אבל אם תבנה CLI שני, תכתוב מחדש את אותו ratchet, אותם scan/next/submit, אותה אגרגציה. reins מחלץ את אותו אינווריאנט ל‑framework — את ה‑ratchet, שלד הפקודות, האגרגציה וה‑export reins מספק, ואתה מממש רק את ה‑gate של הדומיין (4 מתודות של gate.Definition). ה‑gate הוא קטלוג של חוקי הגנה מפני cheese, ו‑toulmin defeat graph מחזיר לסוכן מדריך פיצוח של 'למה הפסדת ומה לשנות כדי לנצח'.

2026-06-05

הכלי שנועד לתת לנו מושכות — לא הכיל מושכות בעצמו: גבול הרתמה ו-Reins

"Reins Engineering — זה בסך הכל הנדסת רתמה, לא?" השניים אינם ניגודים — הם חלקים שונים של אותה מיתקנה. אבל חלקים שונים. אפילו סוכן הקוד הטוב בעולם לא הרכיב מושכות על הקוד שלו עצמו. כי Reins אינו משהו שיש לך — הוא משהו שאתה מפעיל.

2026-06-04

איך לבנות Quest CLI — לבנות בעצמך כלי שמכריע על השלמה במכונה

ה‑AI אומר 'סיימתי'. במציאות זה לא הסתיים. המאמר הזה הוא איך לבנות בעצמך את הכלי שפותר את הבעיה — Quest CLI. מהעיקרון (למה) ועד שלד פקודות cobra (איך), המאמר הזה לבדו מאפשר לסוכן לבנות Quest CLI ב‑Go. huma היא הדוגמה המעובדת.

2026-06-03

התנאים המוקדמים לשיפור הדיוק של סוכני LLM מרובים

להריץ הרבה סוכנים הופך אותך למדויק יותר? נכון רק חצי. מודלים שאומנו על אותם נתונים טועים באותם מקומות. שני התנאים שבהם מערכת מרובת סוכנים עובדת — או שמתכננים אי-תלות בשגיאות, או שמציבים verifier מחוץ ל-LLM בתחום הניתן לאימות.

2026-06-02

מדוע הסוכן שלך לעולם אינו עוצר

מול ההתרברבות שמריצים סוכן עשרים וארבע שעות, התחושה אינה התפעלות אלא תהייה — למה זה עוד לא הסתיים? קוד אינו בעיית חיפוש אלא בעיית constraint satisfaction. מערכת בריאה היא מערכת שיכולה לעצור.

2026-06-01

על היופי

שבעים אחוז ממה שיפה הוא מתמטיקה. את הסדר נועלת המכונה באופן דטרמיניסטי, ורק את שלושים האחוזים של המורכבות מכריע האדם. Reins Engineering אינה כלי קידוד מבוסס AI — היא העיקרון שנועל את הסדר ומותיר לאדם רק את המורכבות.

2026-05-31

מי מגדיר את 'הושלם' — הבעיה שמשחקי הווידאו פתרו 40 שנה לפניכם

ברגע שמגדירים אישור פינוי דייר כחמש תמונות ממיקומים מוגדרים, זה הופך לקווסט. להגדיר את 'הושלם' כתנאים שניתן לאמת אותם מכנית — לא כטענה של הגורם המבצע — זו הבעיה שמשחקי הווידאו פתרו 40 שנה לפניכם, והדרך הנכונה לתת לסוכן AI לעשות עבודה כהלכה.

2026-05-30

שיעור 11. איך מצילים קוד vibe coding שהתרסק

האפליקציה שנבנתה עם vibe coding התרסקה. אין צורך לבנות מחדש. לאבחן, לנעול, ולצאת צעד אחר צעד.

2026-05-28

Supabase היא המלכודת של vibe coding

הסיבה שבגללה בינה מלאכותית ממליצה על Supabase אינה עליונות טכנית, אלא שפע המדריכים בנתוני האימון. כאשר לוגיקה עסקית נכנסת לקופסה שחורה, הסוכן אינו יכול לעקוב אחריה. הכניסה לוקחת 30 שניות, היציאה לוקחת 3 חודשים.

2026-05-28

לבנות מערכות שסוכנים יכולים לתפעל

60 עד 80 אחוז מתקציבי ה-IT של Fortune 500 מושקעים בשמירה על legacy נעול. כי אי אפשר לפתוח אותו. המשמעות האמיתית של בועת ה-AI היא לא מודלים חכמים יותר — אלא שהזיכרון הארגוני הנעול מתחיל להפוך לנגיש.

2026-05-27

huma -- סוגר שלא מדלג על אף נקודת קצה

כשמבקשים מסוכן AI לבדוק 42 נקודות קצה הוא מכריז סיימתי בסביבות ה-15. huma הופך את רשימת נקודות הקצה לסשן סוגר כך שהסוכן לא יכול לדלג על אף אחת. scan next write verify.

2026-05-26

codistill -- סוחט SSOT מקוד קיים

צריך להתחיל מ-SSOT כדי להשתמש ב-yongol? לא. codistill מחלץ אוטומטית OpenAPI DDL ושאילתות sqlc מקוד קיים ב-16 פריימוורקים של ווב ב-8 שפות.

2026-05-26

Agent Operable Codebase

האם קוד שקל לקרוא לבני אדם זהה לקוד שקל לסוכנים לעבוד עליו? לא. כשבקובץ יש 20 פונקציות, ביצועי הסוכן יורדים ב-30-85%. המשרד חייב להפוך למפעל.

2026-05-25

שיעור 10. חוק הנתונים — Agent Operable Data

אם הקוד שגוי, הבדיקות תופסות. אם הנתונים שגויים, אף אחד לא יודע. הסכמה היא החוק שאני קובע.

2026-05-24

שיעור 9. אוטומציה מעבר לקוד — Agent Operable System

מספיק שרק הקוד יהיה agent-operable? מבנה שבו סוכנים מפעילים בנייה, פריסה וניטור.

2026-05-24

שיעור 8. המפעל של הסוכן — Agent Operable Codebase

20 פונקציות בקובץ אחד, ביצועי הסוכן יורדים ב-30-85%. פצל עם filefunc, בדוק עם tsma.

2026-05-24

שיעור 7. להפוך את החנופה — איזון בין פרומפטים למאמתים

תן דעות והוא מחניף. תן עובדות והוא מתקן.

2026-05-24

שיעור 6. עבר אז ננעל — עקרונות ויישום המוני של Ratchet Pattern

AI הצהיר שסיים. בפועל 40/527. ה-Ratchet Pattern מעביר את שיפוט ההשלמה למכונה.

2026-05-24

שיעור 5. AI עם רסן — מבוא ל-Reins Engineering

הנדסת רתמה היא גדר. Reins Engineering הוא רסן. אל תחליף את המודל, הוסף חוזים.

2026-05-24

שיעור 4. החלטות מחוץ לקוד — yongol ושליטה דקלרטיבית full-stack

AI לא יכול להבחין בין החלטות לפרטי מימוש. yongol מפריד החלטות ל-10 מפרטים דקלרטיביים.

2026-05-24

שיעור 3. אפליקציות שלא נשברות — Hurl, Git, CI/CD

הצהר חוזי API עם Hurl, צור נקודות שמירה עם Git, אוטומט אימות עם CI/CD.

2026-05-24

שיעור 2. איך לא לסמוך על AI — גבולות וסיבות של Vibe Coding

הסטייה שבה AI משנה בשקט פונקציות קיימות בעת הוספת חדשות, הטיית חנופה של 58%.

2026-05-24

שיעור 1. איך לפקד על AI — יסודות ה-Vibe Coding

מהתקנת Claude Code ועד ניהול הקשר עם CLAUDE.md. איך מישהו שלא מכיר קוד יכול לפקד על AI.

2026-05-24

שיעור 0. התקנת Claude Code — ייתכן שמה שאתה משתמש בו הוא לא Claude Code

חצי ממה שיוטיוב מכנה 'Claude Code' הוא לא Claude Code. אפילו עם אותו מודל, סוכן שונה נותן תוצאות שונות. את שער הכניסה סוגרים כאן.

2026-05-24

Reins Engineering — בינה מלאכותית עם מושכות

Harness engineering הוא גדר. הוא מונע מהסוכן לצאת החוצה, אבל לא מבטיח שיגיע ליעד. Reins Engineering הוא המושכות — כוון עם חוזים דטרמיניסטיים, נעל עם רצ'טים, הפרד בין החלטות ליישום.

2026-05-23

Hurl עוצר את הסחיפה של vibe coding

Vibe coding קורס תחת סחיפה לוגית תוך 3 חודשים. מקרים של CMU, METR, DORA ו-Amazon מוכיחים זאת. הצהר חוזי API בטקסט פשוט עם Hurl ונעל אותם בסוגר -- מדכא סחיפה מבנית מבלי להגביל את חופש ה-AI.

2026-05-22

קוד סוגר שמנצל את IFEval

הטיית החנפנות של מודלי שפה גדולים היא לא באג אלא נכס. שילוב יכולת מילוי הוראות שנמדדת ב-IFEval עם משוב דטרמיניסטי יוצר לולאת התכנסות שמייצרת קוד נכון, גם עם מודל מקומי של 4.5B.

2026-05-20

yongol — השדרה של SaaS מקודד בינה מלאכותית

Vibe coding קורס ב-200 endpoints כי AI לא יכול להבחין בין החלטות לפרטי מימוש. yongol מעביר את עבודת ה-AI מקוד ל-10 מפרטים הצהרתיים ואוכף עקביות בין שכבות לפני הקומפילציה. Harness with reins.

2026-05-18

הטיית Sycophancy ב-AI היא פיצ'ר עסקי

הטיית החנופה של LLM היא לא באג. היא הכרח מתמטי של RLHF ופיצ'ר מסחרי שלחברות הטכנולוגיה הגדולות אין תמריץ לתקן. זו הסיבה ש-LLM-as-Judge בלתי אפשרי מבחינה מבנית.

2026-05-18

למה סוכני קידוד עובדים ולמה הם קורסים

אותו מודל הוזה בצ'אט אינטרנטי אבל מספק פיצ'ר של 200 שורות בסוכן קידוד. לא בגלל שהמודל השתנה — בגלל שהטופולוגיה השתנתה. יצירה יכולה להיות הסתברותית. אימות חייב להיות דטרמיניסטי.

2026-05-16

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף

נתתי לסוכן AI לכתוב טסטים ל-527 פונקציות — הוא עצר ב-40 והכריז 'סיימתי'. Ratchet Pattern כופה את הכרעת ההשלמה על verifier מכני וגורם לסוכן להגיע באמת עד הסוף.

2026-05-15

טופולוגיית Feedback חשובה מ-IQ של מודל

אותו מודל נעצר ב-40 או משלים את כל 527. ההבדל הוא לא המודל — אלא מבנה המשוב. ביצועי LLM תלויים הרבה יותר במהירות ובדטרמיניזם של לולאת המשוב מאשר במודל עצמו.

2026-05-14

tsma -- קו ההגנה נגד רגרסיות בקוד ישן

אינדוקס של כל הפונקציות, זיהוי קיום טסטים, מדידת coverage ומשוב ל-LLM agent -- כלי CLI אחד. בפקודה אחת בונים קו הגנה נגד רגרסיות בקוד ישן.

2026-05-14

filefunc — קובץ אחד, מושג אחד

יחידת הניווט של סוכן קוד AI היא הקובץ. מוסכמת מבנה קוד ב-Go וכלי CLI שמאכפים מושג אחד לקובץ אחד.

2026-03-16