Reins Engineering

Reins Engineering — الذكاء الاصطناعي بلجام Image: AI generated

حصان بلا لجام

أدوات البرمجة بالذكاء الاصطناعي أصبحت سريعة. تسجيل الدخول في 30 ثانية. المدفوعات في دقيقتين. MVP يُشحن في ثلاثة أسابيع.

بعد ثلاثة أشهر، ينهار كل شيء.

الذكاء الاصطناعي “ينظّف” منطق الدفع فيغيّر حسابات الخصم. طلب إعادة هيكلة يغيّر أسماء حقول API العامة. إضافة ميزة جديدة تكسر المصادقة. وفقًا لبحث جامعة كارنيجي ميلون (MSR 2026)، تزداد تعقيدية الكود بشكل دائم بنسبة 41% بعد تبنّي أدوات البرمجة بالذكاء الاصطناعي. يُظهر تقرير Google DORA Report (2025) انخفاضًا بنسبة 7.2% في استقرار التسليم مع كل زيادة 25% في تبنّي الذكاء الاصطناعي.

المشكلة ليست أن الذكاء الاصطناعي غبي. المشكلة أنه لا يوجد لجام.

الأحزمة مجرد أسوار

ردّت الصناعة بـ"harness engineering". أدوات Linter، والمنسّقات، وCI/CD، وهيكل المشروع، وإرشادات البرمجة. أسوار تمنع الوكيل من الخروج.

الأسوار لا تحدد الاتجاه. مهما فعل الوكيل داخل السور — الكتابة فوق المنطق الحالي، تغيير الأنواع، تخطي انتقالات الحالة — يمرّ الـ linter. يمرّ المنسّق. يمرّ CI. يصل الكود إلى الإنتاج “نظيفًا لكن خاطئًا”.

السرج موضوع. الفارس ممتطٍ. لكن بلا لجام، يتمسك بفخذيه ويسقط بعد ثلاثة أشهر.

Reins Engineering هو نهج هندسي يمنح وكلاء الذكاء الاصطناعي عقودًا حتمية ويمنع التقدم عند انتهاك العقود.

يتكون من ثلاثة عناصر:

1. التغذية الراجعة الحتمية

أعطِ الوكيل حقائق، لا آراء. ليس “هذا يبدو غريبًا” بل “السطر 41: اسم الحقل غير متطابق، المتوقع ‘user_id’، الفعلي ‘userId’.” تغذية راجعة لا تترك مجالًا للمداهنة. وفقًا لدراسة TDAD (arxiv 2026)، تعليمات “طبّق TDD” الإجرائية تزيد الانحدارات سوءًا (6.08% → 9.94%)، بينما تقديم ملفات اختبار محددة في السياق يقلل الانحدارات بنسبة 70% (6.08% → 1.82%).

2. قفل العقود (Ratchet Pattern)

عندما يمرّ التحقق، اقفله. اختبارات Hurl تعلن سلوك API بنص عادي، وتعمل عند كل commit في CI. الاختبارات الناجحة لا يمكن حذفها. الوكيل يمكنه تغيير الكود بحرية، لكن لا يمكنه تغيير السلوك. يُقمع الانحراف هيكليًا.

3. فصل القرارات عن التنفيذ

ثلاثة أشياء مختلطة في الكود — قرارات المستخدم، منطق الأعمال، تفاصيل التنفيذ — يتم فصلها. القرارات تعيش في مواصفات تصريحية (OpenAPI، DDL، مخططات الحالة). التنفيذ يُولَّد بحرية بواسطة الذكاء الاصطناعي. لا يمكن للذكاء الاصطناعي أن يخلط القرارات بالتفاصيل ويكتب فوقها. بقاء القرارات يصبح مستقلًا عن حجم النموذج.

التطور

Prompt Engineering      → Say it well and it works
Context Engineering     → Give good context and it works
Harness Engineering     → Contain it with structure
Reins Engineering       → Steer it with direction

كل مرحلة وُلدت من قيود المرحلة السابقة. المطالبات وحدها افتقرت إلى الاتساق. السياق لم يمنع الوكيل من الانحراف. الأسوار لم تستطع منع الانجراف داخل المحيط.

Reins Engineering ليس سياجًا — إنه لجام. لا يقيّد حرية الوكيل؛ بل يضمن وصول الوكيل إلى الوجهة.

لماذا النماذج الأكبر ليست الحل

“GPT-6 سيحل الأمر.”

لن يفعل. المشكلة ليست ذكاء النموذج — إنها الوسيط. الكود كوسيط لا يميّز القرارات عن التنفيذ. أي نموذج يقرأ الكود يرى القرارات والتفاصيل مختلطة في نفس النص.

نموذج محلي بحجم 4.5B (Gemma4) مع تغذية راجعة حتمية + سياق أمثلة يحرر SSOTs بصفر أخطاء. نموذج متقدم يحرر كودًا خامًا ينتج انحرافًا. الفرق هو البنية، لا الذكاء.

لا تغيّر النموذج. أضف عقدًا.

الدليل

yongol هو تنفيذ Reins Engineering. يتحقق من تناسق 10 مواصفات تصريحية (SSOTs) بـ 287 قاعدة ويولّد الكود.

معيار ZenFlow — SaaS لأتمتة سير العمل متعدد المستأجرين. 32 نقطة نهاية، 14 جدولًا، 47 طلب Hurl. نجحت 11/11 مرحلة. إضافة الميزات لم تُبطئ شيئًا. الاختبارات الحالية لم تفشل أبدًا.

تم توليد backend عامل بنجاح باستخدام نموذج محلي 4.5B. التكلفة $0. بدون اتصال. اللجام يسد الفجوة التي يتركها حجم النموذج.

حزام بلا لجام مجرد سياج

الذكاء الاصطناعي قوي بما فيه الكفاية بالفعل. ما ينقص هو الاتجاه.

ابنِ أسوارًا أعلى وسينحرف الوكيل أسرع داخلها. أمسك اللجام وسيركض الوكيل نحو الوجهة.

Reins Engineering — تحقق حتمي مُهيكل لوكلاء الذكاء الاصطناعي.

yongol — عارضة AI Coding SaaS — تنفيذ Reins Engineering.
Hurl يوقف انحراف Vibe Coding — Hurl + ratchet يقفل سلوك API.
Ratchet Pattern — النظرية وراء التحقق الحتمي وقفل السقّاطة.
IFEval-Exploiting Ratchet Code — حلقات تغذية راجعة تستخدم انحياز المداهنة.

References

Cursino, D. et al. (2026). “Speed at the Cost of Quality? The Impact of AI Coding on Software.” MSR 2026. arxiv.org/abs/2511.04427
Google Cloud (2025). DORA Report 2025. cloud.google.com
Wang, Z. et al. (2026). “TDAD: Test-Driven Agentic Development.” ACM AIWare 2026. arxiv.org/abs/2603.17973
Karpathy, A. (2026). “From Vibe Coding to Agentic Engineering.” thenewstack.io