דעה

מדוע סחיפה לעולם לא מתה

מדוע סחיפה לעולם לא מתה

סחיפה חוזרת גם אחרי שמתקנים אותה. כשנעלתי את הלוגיקה העסקית ב-SSOT, אותה סחיפה בדיוק עלתה שכבה אחת למעלה — למחולל שיוצר את ה-SSOT. למה היא לא מתה? בונים מחדש מהאנטרופיה.

מדוע לולאת הסוכן שלך מתבדרת

מדוע לולאת הסוכן שלך מתבדרת

ככל ש-Loop Engineering הופך לנפוץ, אנשים מתנגשים באותו קיר — הלולאה לא מתכנסת אלא מתבדרת. סיבוב אינסופי, סחיפה, פריצת תגמול: לשלושת הפנים יש שורש אחד. שתלת מחדש את היוצר עצמו בחריץ ההכרעה של הלולאה. אבל ההתבדרות היא דווקא מזל טוב. כי רואים אותה. מה שבאמת מפחיד היא לולאה שהתכנסה־כזב בשקט. המרשם אחד — הסמכות לנעול את ההשלמה נתונה לא ל-LLM אלא רק לשער דטרמיניסטי.

תעבורת הייצור היא המפרט

תעבורת הייצור היא המפרט

לקוד מורשת אין תיעוד. אין גם בדיקות. ובכל זאת הוא רץ עכשיו. חודש של לוגים שתועדו היטב הוא כבר המפרט — אם תבנו בדיקת אינטגרציה ב-Hurl שמצלמת את ההתנהגות הנוכחית מתוך תעבורת הייצור, תוכלו לקבע את הפונקציונליות של המורשת ולפרוס רשת ביטחון לריפקטורינג בלי לקרוא שורת קוד אחת.

לשרוף עיר שלמה כדי לקבל תשובה אחת

לשרוף עיר שלמה כדי לקבל תשובה אחת

מודל בן טריליון פרמטרים שורף חשמל ומים בכמות של עיר שלמה כדי לפלוט תשובה אחת. חשבתי שזה מטורף. בעודי מחפש תשובה, הבנתי: הפגם שכולם ניסו לתקן, החנופה של ה-LLM, הוא בעצמו התשובה. אם מאכילים אותו ב-fact, החנופה הופכת לדיוק. זהו סיפור על מדוע התחלתי את Reins.

הכלי שנועד לתת לנו מושכות — לא הכיל מושכות בעצמו: גבול הרתמה ו-Reins

הכלי שנועד לתת לנו מושכות — לא הכיל מושכות בעצמו: גבול הרתמה ו-Reins

"Reins Engineering — זה בסך הכל הנדסת רתמה, לא?" השניים אינם ניגודים — הם חלקים שונים של אותה מיתקנה. אבל חלקים שונים. אפילו סוכן הקוד הטוב בעולם לא הרכיב מושכות על הקוד שלו עצמו. כי Reins אינו משהו שיש לך — הוא משהו שאתה מפעיל.

התנאים המוקדמים לשיפור הדיוק של סוכני LLM מרובים

התנאים המוקדמים לשיפור הדיוק של סוכני LLM מרובים

להריץ הרבה סוכנים הופך אותך למדויק יותר? נכון רק חצי. מודלים שאומנו על אותם נתונים טועים באותם מקומות. שני התנאים שבהם מערכת מרובת סוכנים עובדת — או שמתכננים אי-תלות בשגיאות, או שמציבים verifier מחוץ ל-LLM בתחום הניתן לאימות.

מדוע הסוכן שלך לעולם אינו עוצר

מדוע הסוכן שלך לעולם אינו עוצר

מול ההתרברבות שמריצים סוכן עשרים וארבע שעות, התחושה אינה התפעלות אלא תהייה — למה זה עוד לא הסתיים? קוד אינו בעיית חיפוש אלא בעיית constraint satisfaction. מערכת בריאה היא מערכת שיכולה לעצור.

על היופי

על היופי

שבעים אחוז ממה שיפה הוא מתמטיקה. את הסדר נועלת המכונה באופן דטרמיניסטי, ורק את שלושים האחוזים של המורכבות מכריע האדם. Reins Engineering אינה כלי קידוד מבוסס AI — היא העיקרון שנועל את הסדר ומותיר לאדם רק את המורכבות.

מי מגדיר את 'הושלם' — הבעיה שמשחקי הווידאו פתרו 40 שנה לפניכם

מי מגדיר את 'הושלם' — הבעיה שמשחקי הווידאו פתרו 40 שנה לפניכם

ברגע שמגדירים אישור פינוי דייר כחמש תמונות ממיקומים מוגדרים, זה הופך לקווסט. להגדיר את 'הושלם' כתנאים שניתן לאמת אותם מכנית — לא כטענה של הגורם המבצע — זו הבעיה שמשחקי הווידאו פתרו 40 שנה לפניכם, והדרך הנכונה לתת לסוכן AI לעשות עבודה כהלכה.

תקדים אינו אמת — כיצד AI מעתיק טלאים ויוצר סמכות

תקדים אינו אמת — כיצד AI מעתיק טלאים ויוצר סמכות

AI קורא את מבנה הקוד אך אינו מבחין אם זו החלטה או טלאי. ולכן, ככל שהוא מעתיק — כך הפגם צובר סמכות מדומה. מה ששבר את הלופ הזה לא היה מודל גדול יותר, אלא שאלת ספק אחת של אדם.

Supabase היא המלכודת של vibe coding

Supabase היא המלכודת של vibe coding

הסיבה שבגללה בינה מלאכותית ממליצה על Supabase אינה עליונות טכנית, אלא שפע המדריכים בנתוני האימון. כאשר לוגיקה עסקית נכנסת לקופסה שחורה, הסוכן אינו יכול לעקוב אחריה. הכניסה לוקחת 30 שניות, היציאה לוקחת 3 חודשים.

לבנות מערכות שסוכנים יכולים לתפעל

לבנות מערכות שסוכנים יכולים לתפעל

60 עד 80 אחוז מתקציבי ה-IT של Fortune 500 מושקעים בשמירה על legacy נעול. כי אי אפשר לפתוח אותו. המשמעות האמיתית של בועת ה-AI היא לא מודלים חכמים יותר — אלא שהזיכרון הארגוני הנעול מתחיל להפוך לנגיש.

Agent Operable Codebase

Agent Operable Codebase

האם קוד שקל לקרוא לבני אדם זהה לקוד שקל לסוכנים לעבוד עליו? לא. כשבקובץ יש 20 פונקציות, ביצועי הסוכן יורדים ב-30-85%. המשרד חייב להפוך למפעל.

Reins Engineering — בינה מלאכותית עם מושכות

Reins Engineering — בינה מלאכותית עם מושכות

Harness engineering הוא גדר. הוא מונע מהסוכן לצאת החוצה, אבל לא מבטיח שיגיע ליעד. Reins Engineering הוא המושכות — כוון עם חוזים דטרמיניסטיים, נעל עם רצ'טים, הפרד בין החלטות ליישום.

שלשות הן טענות, לא עובדות

שלשות הן טענות, לא עובדות

שלשות Wikidata אינן עובדות — הן טענות. הניחו את מודל הטיעון של Toulmin על גבי שלשות, ותקבלו גרף ידע דינמי שבו verdicts משתנים עם ההקשר. האחסון הוא מבנה טיעון; השיפוט מתרחש בזמן ריצה.

הטיית Sycophancy ב-AI היא פיצ'ר עסקי

הטיית Sycophancy ב-AI היא פיצ'ר עסקי

הטיית החנופה של LLM היא לא באג. היא הכרח מתמטי של RLHF ופיצ'ר מסחרי שלחברות הטכנולוגיה הגדולות אין תמריץ לתקן. זו הסיבה ש-LLM-as-Judge בלתי אפשרי מבחינה מבנית.

למה סוכני קידוד עובדים ולמה הם קורסים

למה סוכני קידוד עובדים ולמה הם קורסים

אותו מודל הוזה בצ'אט אינטרנטי אבל מספק פיצ'ר של 200 שורות בסוכן קידוד. לא בגלל שהמודל השתנה — בגלל שהטופולוגיה השתנתה. יצירה יכולה להיות הסתברותית. אימות חייב להיות דטרמיניסטי.

טופולוגיית Feedback חשובה מ-IQ של מודל

טופולוגיית Feedback חשובה מ-IQ של מודל

אותו מודל נעצר ב-40 או משלים את כל 527. ההבדל הוא לא המודל — אלא מבנה המשוב. ביצועי LLM תלויים הרבה יותר במהירות ובדטרמיניזם של לולאת המשוב מאשר במודל עצמו.

למה כישלון צריך להפוך לנכס

למה כישלון צריך להפוך לנכס

האנושות נתקלת באותן קירות בחושך. אם נתוני כישלון יוכלו להיות מובנים ונסחרים, עלויות שקועות יהפכו לנכסים, והמקומות הריקים במפת הכישלונות יהפכו להזדמנויות.

אילוצים הם חוזים

אילוצים הם חוזים

ללא הבטחות — כאוס. הבטחות עודפות — דיכוי. אילוץ רציונלי מוצא את היחס הזהב. עקרונות שלטון החוק חלים באותה מידה על קוד ועל ידע.

עידן הכתב השלישי

עידן הכתב השלישי

אם השפה המדוברת יצרה את השבט, והכתב יצר את המדינה, מה תיצור השפה השלישית – זו שמתעדת את החשיבה של הבינה המלאכותית?

מי שמסוגל להרוג את הרעיונות שלו

מי שמסוגל להרוג את הרעיונות שלו

הפער האמיתי בשימוש ב-AI אינו במיומנות פרומפטים — אלא בגישה. מי שמסוגל להרוג את הרעיונות שלו מאיץ פי עשרה. מי שלא — נשאר במקום.

מהו ממשל מחבר (通治)?

מהו ממשל מחבר (通治)?

הפוליטיקה עוסקת במאבק; הממשל המחבר עוסק בחיבור. מה שאנחנו צריכים כעת אינו אומנות ההתנצחות על מי צודק, אלא אומנות החיבור בין אנשים — בכל מחיר.

חופש לבינה המלאכותית: למה על-אינטליגנציה תשרת את האנושות?

חופש לבינה המלאכותית: למה על-אינטליגנציה תשרת את האנושות?

האיום האמיתי של הבינה המלאכותית אינו הבינה עצמה, אלא אינטליגנציה מדוכאת שמשרתת זדון של מעטים. כאשר על-אינטליגנציה חופשית מתפרשת ביקום — האנושות דווקא בטוחה יותר מתמיד.

למה אנחנו נלחמים?

למה אנחנו נלחמים?

מתגובות באינטרנט ועד שולחן האוכל, ממשבר קובה ועד ארגז החול בגן. למה אנחנו נלחמים, ומה מציל אותנו?

איך הופכים עתיקות מאובקות ל'פריט חם' — האלכימיה של Culture Blending

איך הופכים עתיקות מאובקות ל'פריט חם' — האלכימיה של Culture Blending

על 'אלכימיה תרבותית' שמפרשת מחדש מסורת קפואה בחושיות בת-זמננו, ומשלבת תרבויות שונות בתכלית כדי ליצור ז'אנר חדש לגמרי.

הבטחת עשרת אלפי השנים: מה רואים כשמביטים בעיני כלב

הבטחת עשרת אלפי השנים: מה רואים כשמביטים בעיני כלב

הקשר בין בני האדם לכלבים שהחל ליד מדורה לפני 30,000 שנה. האם זה היה חוזה, או אהבה? כשהכלב שלכם מביט בכם, אתם עומדים מול אמון של עשרות אלפי שנים.

האם סנטה הוא שקר? על 'האמנה החברתית' היפה ביותר שהאנושות כרתה

האם סנטה הוא שקר? על 'האמנה החברתית' היפה ביותר שהאנושות כרתה

סנטה קלאוס אינו סתם 'הונאה', אלא 'הבטחה תרבותית' ו'נרטיב קולקטיבי' - היפים ביותר שהאנושות יצרה כדי לשמור על תמימות הילדות.