Image: AI generated
קיר 3 החודשים
אם האפליקציה שבניתם ב-vibe coding קרסה אחרי 3 חודשים, אם אתם חווים סחיפה שבה ה-AI דורס לוגיקה קיימת, אם אתם רוצים להגן על חוזי API משינויי קוד – Hurl וסוגר הם הפתרון.
אתה בונה SaaS עם vibe coding. בהתחלה מהיר. “תעשה לוגין” – 30 שניות. “תוסיף תשלומים” – 2 דקות. MVP תוך 3 שבועות.
אחרי 3 חודשים, דברים מוזרים קורים. ה-AI “מסדר” את לוגיקת התשלום ומשנה בשקט את חישוב ההנחה. הוספת endpoint חדש שוברת את האימות הקיים. מבקש refactoring ושמות השדות ב-API הציבורי משתנים – כל הלקוחות מתים.
זה נקרא סחיפה לוגית – ה-AI משנה באופן לא מכוון לוגיקה עסקית קיימת. באגי רגרסיה קיימים גם בפיתוח מסורתי. אבל סחיפה לוגית שונה. שינויים שהמפתח לא התכוון אליהם קורים בלי שהוא שם לב, בכל בסיס הקוד. כי כל prompt מתחיל בחלון הקשר חדש.
סחיפה במספרים
זה לא תחושה. יש נתונים.
מחיר המהירות הוא מורכבות. צוות Carnegie Mellon השווה 807 מאגרי GitHub לפני ואחרי אימוץ Cursor (MSR 2026). בחודש הראשון, תוספות קוד עלו פי 3-5. אחרי חודשיים יתרון המהירות נעלם. מה שנשאר: עלייה של 30% באזהרות ניתוח סטטי ועלייה קבועה של 41% במורכבות הקוד. Liu et al. (2026) ניתחו 302,600 commits של AI ב-6,299 מאגרים – חוב טכני לא פתור קפץ ממאות בודדות תחילת 2025 ליותר מ-110,000 בפברואר 2026.
לא הפך מהיר יותר – הפך איטי יותר. METR ביצעה ניסוי מבוקר אקראי עם 16 מפתחי קוד פתוח מנוסים (2025). בפרויקטים שהכירו היטב, הקבוצה שהשתמשה בכלי AI לקחה 19% יותר זמן. אבל המפתחים עצמם חשו שיפור של 20%. הפער: 39pp.
יציבות קורסת בקנה מידה. לפי דוח Google DORA (2025), על כל עלייה של 25% באימוץ AI, יציבות אספקת תוכנה יורדת ב-7.2%.
באמת קרס. Amazon חייבה כלי קידוד AI ברחבי החברה ב-2025 ופרסה 21,000 סוכני AI. באותה תקופה, כ-30,000 עובדים פוטרו. התוצאה: 4 תקריות Sev-1 ב-90 יום.
“תעשה TDD” זה לא התשובה
מחקר TDAD (arxiv 2026) בדק את זה בדיוק. Qwen3-Coder 30B פתר 100 מקרים של SWE-bench Verified.
| תנאי | שיעור רגרסיה |
|---|---|
| בסיס (ללא הוראת בדיקה) | 6.08% |
| הוראה פרוצדורלית “תעשה TDD” | 9.94% (גרוע יותר) |
| מתן קבצי בדיקה מושפעים כהקשר | 1.82% (הפחתה של 70%) |
לא הוראה “איך לבדוק”, אלא חוזה “מה חייב לעבור”.
Hurl: חוזים בטקסט פשוט
Hurl מיישם את עקרון Design by Contract של Meyer (1992) על גבול HTTP. כלי בדיקה שמצהיר בקשות HTTP ותגובות צפויות בטקסט פשוט. מתוחזק על ידי Orange, בינארי Rust ללא תלויות, 18.7k כוכבים ב-GitHub.
# כניסה מוצלחת
POST http://localhost:8080/api/auth/login
{
"email": "test@example.com",
"password": "secret123"
}
HTTP 200
[Asserts]
jsonpath "$.token" exists
jsonpath "$.user.email" == "test@example.com"
# גישה ללא אימות מחזירה 401
GET http://localhost:8080/api/pages
HTTP 401
שני חוזים. כניסה חייבת להחזיר 200 עם token, גישה ללא אימות חייבת להחזיר 401.
למה Hurl
בדיקות יחידה מאמתות פונקציות פנימיות – מצומדות מבנית ליישום. Hurl יושב על גבול HTTP. מצהיר רק בקשות ותגובות. בלתי תלוי ביישום באופן טבעי.
מה ש-Hurl מאמת הוא לא קוד אלא התנהגות.
נעילת סוגר
כש-test Hurl עובר, הוא ננעל. זה הרצ’ט. test Hurl נעול הוא ratchet code — קוד דטרמיניסטי שהופך חוזה API שעבר לבלתי הפיך. הסוכן חייב לבצע refactoring תוך שמירה על כל ההתנהגות הקיימת.
עובד גם על Legacy
שלב 1: ללכוד התנהגות נוכחית ב-Hurl. שלב 2: לחבר ל-CI. שלב 3: עכשיו בטוח.
לא עבודת יסודות אלא חיזוק סייסמי. לחזק את הבניין בלי לסגור את החנות.
לא סוף vibe coding, אלא אבולוציה
Karpathy הכריז בפברואר 2026: “עידן ה-vibe coding נגמר.” הפרדיגמה החדשה היא הנדסה סוכנית. Storey (2026) תיאר חוב קוגניטיבי וחוב כוונה. קובץ Hurl הוא בדיוק החצנה של הכוונה.
קובץ Hurl אחד = חוזה אחד. אל תשנה את המודל. הוסף חוזה.
מאמרים קשורים
- yongol – השדרה של SaaS קידוד AI – מאלץ עקביות full-stack עם 10 SSOTs. Hurl אחד מהם.
- Ratchet Pattern – איך לגרום לסוכנים לסיים את העבודה – רקע תיאורטי של אימות דטרמיניסטי ונעילת סוגר.
- קוד סוגר שמנצל את IFEval – לולאות משוב שמנצלות הטיית חנפנות ו-Reins.
מקורות
- Cursino, D. et al. (2026). “Speed at the Cost of Quality? The Impact of AI Coding on Software.” MSR 2026. arxiv.org/abs/2511.04427
- METR (2025). “Measuring the Impact of Early AI on Experienced Open-source Developer Productivity.” arxiv.org/abs/2507.09089
- Google Cloud (2025). DORA Report 2025. cloud.google.com
- Wang, Z. et al. (2026). “TDAD: Test-Driven Agentic Development.” ACM AIWare 2026. arxiv.org/abs/2603.17973
- Autonoma (2026). “Amazon Vibe Coding Failures: 4 Sev-1s in 90 Days.” getautonoma.com
- CNBC (2026). “Amazon convenes ‘deep dive’ internal meeting to address AI-related outages.” cnbc.com
- Thoughtworks (2025). “Spec-Driven Development.” Technology Radar Vol.33. thoughtworks.com
- Karpathy, A. (2026). “From Vibe Coding to Agentic Engineering.” thenewstack.io
- Fowler, M. et al. (2025). “SDD Tools.” martinfowler.com
- Liu, Y. et al. (2026). “Debt Behind the AI Boom.” arxiv.org/abs/2603.28592
- Meyer, B. (1992). “Applying ‘Design by Contract’.” Computer, 25(10), pp. 40-51. doi.org/10.1109/2.161279
- Storey, M.-A. (2026). “From Technical Debt to Cognitive and Intent Debt.” arxiv.org/abs/2603.22106
- Hurl. hurl.dev | github.com/Orange-OpenSource/hurl
יומן שינויים
- 2026-05-22: מהדורה ראשונה