التحقق الحتمي

من يُعرِّف «الإنجاز»؟ — مسألةٌ حلَّتها ألعاب الفيديو قبل أربعين عاماً

من يُعرِّف «الإنجاز»؟ — مسألةٌ حلَّتها ألعاب الفيديو قبل أربعين عاماً

حين تُعرِّف التحقق من إخلاء المستأجر بخمس صور، يتحول الأمر إلى مهمة لعبة. تحديد «الإنجاز» بوصفه شرطاً قابلاً للتحقق آلياً لا ادّعاءً من المنفِّذ — تلك مسألةٌ حلَّتها ألعاب الفيديو قبل أربعين عاماً، وهي الطريقة الصحيحة لإسناد العمل إلى وكلاء الذكاء الاصطناعي.

السابقة ليست صحيحة — كيف يُضفي الذكاء الاصطناعي السلطة على الحلول الترقيعية

السابقة ليست صحيحة — كيف يُضفي الذكاء الاصطناعي السلطة على الحلول الترقيعية

يقرأ الذكاء الاصطناعي بنية الكود لكنه لا يميز بين القرار المدروس والحل الترقيعي المؤقت. ولهذا يكتسب الخلل سلطةً زائفة كلما تكررت نسخه. ما كسر هذه الحلقة لم يكن نموذجاً أضخم، بل سؤال مضاد من إنسان في جملة واحدة.

Hurl يوقف انحراف Vibe Coding

Hurl يوقف انحراف Vibe Coding

ينهار Vibe Coding بسبب الانحراف المنطقي خلال 3 أشهر. حالات CMU وMETR وDORA وAmazon تثبت ذلك. أعلن عقود API بنص عادي عبر Hurl واقفلها بسقاطة — تقمع الانحراف هيكلياً دون تقييد حرية الذكاء الاصطناعي.

كود السقاطة الذي يستغل IFEval

كود السقاطة الذي يستغل IFEval

انحياز المداهنة في النماذج اللغوية الكبيرة ليس خللاً بل أصل. عند الجمع بين قدرة اتباع التعليمات التي يقيسها IFEval والتغذية الراجعة الحتمية، حتى نموذج محلي بحجم 4.5B ينتج حلقة تقارب تولّد كوداً صحيحاً.