טכנולוגיה

למה מודלים חכמים לא יודעים להסביר

למה מודלים חכמים לא יודעים להסביר

מודלים חכמים מדברים בשפה מורכבת, ומודלים שמסבירים היטב חלשים בהיסק. הפתרון: לחלק ביניהם. שיטה מעשית להפרדת מודל תקשורת (ראשי) ומודל היסק (תת-סוכן) ב-Claude Code, ולמה המבנה הזה עובד.

abloq — בלוג שסוכן מפעיל, האימות ננעל בידי מכונה

abloq — בלוג שסוכן מפעיל, האימות ננעל בידי מכונה

אם תפקיד בלוג בידי סוכן, מאמרים יֵצְאוּ. הבעיה היא שאי אפשר לסמוך עליהם — הוא מזייף מקורות, מעלה את ה‑lastmod של מאמר שכלל לא תיקן, ונוגע בקבצים שלא ביקשת. אם אדם יצטרך לבדוק הכול, אין טעם להפקיד את העבודה. התשובה של abloq היא חלוקת עבודה: הייצור הסתברותי, האימות דטרמיניסטי. מה שהאדם כותב הוא דף אחד של מפרט insight (insight.yaml) בלבד, את הכתיבה·התרגום·הרענון·חיזוק הראיות הסוכן מבצע ב‑Quest, והאיכות מובטחת על ידי gate דטרמיניסטי שנגזר מדף אחד של blog.yaml. PASS נעול הוא בלתי הפיך — הסוכן עשוי להיות חד‑פעמי, אך ההתקדמות מצטברת.

reins — להשאיר רק את הדומיין מ‑Quest CLI, ולהפוך את ה‑ratchet ל‑framework

reins — להשאיר רק את הדומיין מ‑Quest CLI, ולהפוך את ה‑ratchet ל‑framework

how-make-quest לימד איך לבנות Quest CLI במו ידיך. אבל אם תבנה CLI שני, תכתוב מחדש את אותו ratchet, אותם scan/next/submit, אותה אגרגציה. reins מחלץ את אותו אינווריאנט ל‑framework — את ה‑ratchet, שלד הפקודות, האגרגציה וה‑export reins מספק, ואתה מממש רק את ה‑gate של הדומיין (4 מתודות של gate.Definition). ה‑gate הוא קטלוג של חוקי הגנה מפני cheese, ו‑toulmin defeat graph מחזיר לסוכן מדריך פיצוח של 'למה הפסדת ומה לשנות כדי לנצח'.

איך לבנות Quest CLI — לבנות בעצמך כלי שמכריע על השלמה במכונה

איך לבנות Quest CLI — לבנות בעצמך כלי שמכריע על השלמה במכונה

ה‑AI אומר 'סיימתי'. במציאות זה לא הסתיים. המאמר הזה הוא איך לבנות בעצמך את הכלי שפותר את הבעיה — Quest CLI. מהעיקרון (למה) ועד שלד פקודות cobra (איך), המאמר הזה לבדו מאפשר לסוכן לבנות Quest CLI ב‑Go. huma היא הדוגמה המעובדת.

filefunc × Hono — קוד שסוכן קורא בבת אחת: מ-60 שורות ל-18

filefunc × Hono — קוד שסוכן קורא בבת אחת: מ-60 שורות ל-18

ריפקטרינג של Hono — פריימוורק מוכח עם 23k כוכבים — באמצעות filefunc. כל 4419 הטסטים עברו. ואז מדדנו: כמות הקוד שסוכן קורא כשהוא פותח מושג אחד ירדה מחציון 60 שורות ל-18 — ירידה של 71%. לא מספר הקבצים הוא העיקר — אלא אורך הקריאה.

GEO: איך לגרום ל-AI לצטט את התוכן שלך

GEO: איך לגרום ל-AI לצטט את התוכן שלך

אם התוכן שלך לא מצוטט בתשובות שנוצרות על ידי AI, הוא כאילו לא קיים. לפי מחקר GEO: ציטוט מקורות +30%, סטטיסטיקות +32%, ציטוטים ישירים +41% שיפור בנראות. תשתית, sitemap, Wayback Machine, ציטוטים אקדמיים, פעילות חברתית — חמישה צירים להבטחת נראות AI.

huma -- סוגר שלא מדלג על אף נקודת קצה

huma -- סוגר שלא מדלג על אף נקודת קצה

כשמבקשים מסוכן AI לבדוק 42 נקודות קצה הוא מכריז סיימתי בסביבות ה-15. huma הופך את רשימת נקודות הקצה לסשן סוגר כך שהסוכן לא יכול לדלג על אף אחת. scan next write verify.

codistill -- סוחט SSOT מקוד קיים

codistill -- סוחט SSOT מקוד קיים

צריך להתחיל מ-SSOT כדי להשתמש ב-yongol? לא. codistill מחלץ אוטומטית OpenAPI DDL ושאילתות sqlc מקוד קיים ב-16 פריימוורקים של ווב ב-8 שפות.

Hurl עוצר את הסחיפה של vibe coding

Hurl עוצר את הסחיפה של vibe coding

Vibe coding קורס תחת סחיפה לוגית תוך 3 חודשים. מקרים של CMU, METR, DORA ו-Amazon מוכיחים זאת. הצהר חוזי API בטקסט פשוט עם Hurl ונעל אותם בסוגר -- מדכא סחיפה מבנית מבלי להגביל את חופש ה-AI.

קוד סוגר שמנצל את IFEval

קוד סוגר שמנצל את IFEval

הטיית החנפנות של מודלי שפה גדולים היא לא באג אלא נכס. שילוב יכולת מילוי הוראות שנמדדת ב-IFEval עם משוב דטרמיניסטי יוצר לולאת התכנסות שמייצרת קוד נכון, גם עם מודל מקומי של 4.5B.

yongol — השדרה של SaaS מקודד בינה מלאכותית

yongol — השדרה של SaaS מקודד בינה מלאכותית

Vibe coding קורס ב-200 endpoints כי AI לא יכול להבחין בין החלטות לפרטי מימוש. yongol מעביר את עבודת ה-AI מקוד ל-10 מפרטים הצהרתיים ואוכף עקביות בין שכבות לפני הקומפילציה. Harness with reins.

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף

Ratchet Pattern — איך לגרום לסוכן להגיע עד הסוף

נתתי לסוכן AI לכתוב טסטים ל-527 פונקציות — הוא עצר ב-40 והכריז 'סיימתי'. Ratchet Pattern כופה את הכרעת ההשלמה על verifier מכני וגורם לסוכן להגיע באמת עד הסוף.

tsma -- קו ההגנה נגד רגרסיות בקוד ישן

tsma -- קו ההגנה נגד רגרסיות בקוד ישן

אינדוקס של כל הפונקציות, זיהוי קיום טסטים, מדידת coverage ומשוב ל-LLM agent -- כלי CLI אחד. בפקודה אחת בונים קו הגנה נגד רגרסיות בקוד ישן.

toulmin — מנוע כללים שמחשב חוזים

toulmin — מנוע כללים שמחשב חוזים

מנועי כללים התייחסו למושא האימות כעובדה (fact) במשך 60 שנה. toulmin מתייחס אליו כטענה (claim). מימוש מודל הטיעון של טולמין כמנוע כללים ב-Go.

filefunc — קובץ אחד, מושג אחד

filefunc — קובץ אחד, מושג אחד

יחידת הניווט של סוכן קוד AI היא הקובץ. מוסכמת מבנה קוד ב-Go וכלי CLI שמאכפים מושג אחד לקובץ אחד.

Feature Chain — מעקב אחרי כל ה-full-stack עם operationId אחד

Feature Chain — מעקב אחרי כל ה-full-stack עם operationId אחד

אילו קבצים צריך לגעת בהם כדי לשנות פיצ'ר אחד? Feature Chain מקבל operationId אחד ומפיק אוטומטית את כל ההיקף — מפרט API, סכמת DB, מדיניות הרשאות, תרשים מצבים, מימושי פונקציות, תרחישי בדיקה, ופרונט-אנד.

whyso — מה ש-git blame לא מראה

whyso — מה ש-git blame לא מראה

git blame מראה מי, מתי ומה שונה. whyso מראה למה שונה. כלי שמחלץ אוטומטית היסטוריית שינויים לפי קבצים מנתוני סשן של Claude Code.

הפתרון לשינוי האקלים נמצא בחלל? כן, באמת.

הפתרון לשינוי האקלים נמצא בחלל? כן, באמת.

התקנת סוכך שמש בין השמש לכדור הארץ כדי להחזיר את האקלים לאחור. פשוט מדלגים על הציפוי במפעל מראות דייסון, הוא טס בלי דלק, ואם מסירים אותו הכול חוזר לקדמותו. החשבון מסתדר.

SSaC — Service Sequences as Code

SSaC — Service Sequences as Code

קונספט בלתי תלוי שפה המפרק את הזרימה העסקית בתוך פונקציות שירות לבלוקים הצהרתיים (sequences). הצהר רק את ה-what באמצעות 10 טיפוסים קבועים, וה-codegen ימלא את ה-how.

חשיבת AI מעקרונות ראשונים: שיטה בת 5 שלבים עם מקרי בוחן

חשיבת AI מעקרונות ראשונים: שיטה בת 5 שלבים עם מקרי בוחן

לא מבקשים תשובות מ-AI — משתמשים בו כלוח תהודה לאימות, פירוק ובנייה מחדש של הנחות. שיטה בת 5 שלבים עם שני מקרי בוחן מהמציאות.

לבשל עם חום שהולך לאיבוד? הפוטנציאל והמציאות של מכשירי בישול עם משאבת חום לשחזור חום פסולת

לבשל עם חום שהולך לאיבוד? הפוטנציאל והמציאות של מכשירי בישול עם משאבת חום לשחזור חום פסולת

טכנולוגיית משאבת חום בטמפרטורה גבוהה לשחזור חום פסולת שמצמצמת באופן מהפכני את בזבוז האנרגיה במכשירי בישול קיימים – עד היכן הגענו וכיצד ניתן להשלים את הטכנולוגיה?

לבנות סכר מחול מדברי, ואחרי 30 שנה הסכר הופך ליער

לבנות סכר מחול מדברי, ואחרי 30 שנה הסכר הופך ליער

טכנולוגיית Oasis Pellet הופכת חול מדברי חסר ערך למאגר מים באמצעות דבק ביולוגי, ובתום חייו — לקרקע פורייה.

הסוללה שלא נדלקת: איך להפוך חשמל מבוזבז לדשן וחימום

הסוללה שלא נדלקת: איך להפוך חשמל מבוזבז לדשן וחימום

אחסון חשמל מבוזבז מקיצוץ ייצור סולארי בסוללת אדיסון חסינת שריפה, וייצור דשן ותמיסת אוריאה מהמימן — מודל שילוב אנרגיה-חקלאות לעצמאות מלאה.