Reins Engineering

Hurl يوقف Logic Drift في Vibe Coding
ينهار Vibe coding إلى logic drift خلال ثلاثة أشهر. CMU وMETR وDORA وAmazon أثبتوا ذلك. أعلن عقود API بـ plain text باستخدام Hurl وأقفلها بـ ratchet — يُكبح الـ drift هيكلياً دون تقييد حرية الذكاء الاصطناعي.

كود Ratchet الذي يستغل IFEval
انحياز التملق في LLM ليس خللاً بل أصل. عند دمج قدرة اتباع التعليمات التي يقيسها IFEval مع التغذية الراجعة الحتمية، يتشكل حلقة تقارب تمكّن حتى نموذجاً محلياً بحجم 4.5B من توليد كود دقيق.

yongol — عارضة السفينة للبرمجيات السحابية المبنية بالذكاء الاصطناعي
تنهار البرمجة الحدسية عند 200 نقطة نهاية لأن الذكاء الاصطناعي لا يستطيع التمييز بين القرارات وتفاصيل التنفيذ. yongol ينقل هدف عمل الذكاء الاصطناعي من الشفرة إلى 10 مواصفات تصريحية ويفرض التناسق بين الطبقات قبل التجميع. Harness with reins.

تحيّز المداهنة في الذكاء الاصطناعي ميزة تجارية
تحيّز المداهنة في LLM ليس خللاً. إنه حتمية رياضية من RLHF، وميزة تجارية لا حافز لشركات التقنية الكبرى لإصلاحها. هذا ما يجعل LLM-as-Judge مستحيلاً بنيوياً.

لماذا تعمل وكلاء البرمجة ولماذا تنهار
نفس النموذج يُهلوس في الدردشة ويعمل في وكيل البرمجة. ليس لأن النموذج تغيّر، بل لأن topology تغيّرت. التوليد يمكن أن يكون احتمالياً. التحقق يجب أن يكون حتمياً.

Ratchet Pattern — كيف تجعل الوكيل يكمل المهمة حتى النهاية
طلبت من وكيل AI كتابة اختبارات لـ 527 دالة، فأعلن 'انتهيت' عند 40 فقط. Ratchet Pattern يفرض حكم الإنجاز عبر verifier آلي، مما يجبر الوكيل على المضي حتى النهاية.

توبولوجيا التغذية الراجعة أهم من ذكاء النموذج
نفس النموذج يتوقف عند 40 أحياناً ويُكمل 527 أحياناً أخرى. الفرق ليس في النموذج بل في بنية التغذية الراجعة. أداء LLM يتحدد بمدى سرعة وحتمية حلقة التغذية الراجعة التي يعمل عليها أكثر من النموذج ذاته.

tsma — خط الدفاع ضد التراجع في الكود القديم
أداة CLI تفهرس جميع الدوال، وتكتشف وجود الاختبارات، وتقيس التغطية، وتقدم تغذية راجعة دقيقة لوكلاء LLM. أمر واحد يبني خط دفاع ضد التراجع في الكود القديم.

filefunc — مفهوم واحد لكل ملف
وحدة استكشاف وكلاء الكود الذكية هي الملف. اتفاقية هيكلة كود Go وأداة CLI تفرض مفهومًا واحدًا لكل ملف.