LLM

الشروط المسبقة لتحسين دقة وكلاء LLM المتعددين
هل يصبح النظام أدق عند تشغيل عدة وكلاء؟ هذا صحيح بالنصف فقط. النماذج المدرَّبة على البيانات نفسها تخطئ في الموضع نفسه. شرطا عمل الوكلاء المتعددين اثنان — أن تُصمِّم استقلالية الأخطاء، أو أن تُقيم verifier خارج الـ LLM في مجال قابل للتحقق.

كود السقاطة الذي يستغل IFEval
انحياز المداهنة في النماذج اللغوية الكبيرة ليس خللاً بل أصل. عند الجمع بين قدرة اتباع التعليمات التي يقيسها IFEval والتغذية الراجعة الحتمية، حتى نموذج محلي بحجم 4.5B ينتج حلقة تقارب تولّد كوداً صحيحاً.

تحيّز المداهنة في الذكاء الاصطناعي ميزة تجارية
تحيز المداهنة في LLM ليس خللاً. إنه حتمية رياضية لـ RLHF وميزة تجارية ليس لدى شركات التكنولوجيا الكبرى حافز لإصلاحها. هذا هو السبب في أن LLM-as-Judge مستحيل بنيوياً.

لماذا تعمل وكلاء البرمجة ولماذا تنهار
نفس النموذج يُهلوس في الدردشة لكنه يُنجز ميزة من 200 سطر في وكيل البرمجة. ليس لأن النموذج تغيّر — بل لأن الطوبولوجيا تغيّرت. التوليد يمكن أن يكون احتمالياً. التحقق يجب أن يكون حتمياً.

طوبولوجيا التغذية الراجعة أهم من ذكاء النموذج
نفس النموذج يتوقف عند 40 أو يُكمل 527 بالكامل. الفرق ليس في النموذج — بل في بنية التغذية الراجعة. أداء LLM يعتمد على سرعة وحتمية حلقة التغذية الراجعة أكثر بكثير مما يعتمد على النموذج نفسه.

tsma -- خط الدفاع ضد التراجع في الكود القديم
أداة CLI تفهرس جميع الدوال، وتكتشف وجود الاختبارات، وتقيس التغطية، وتقدم تغذية راجعة دقيقة لوكلاء LLM. أمر واحد يبني خط دفاع ضد التراجع في الكود القديم.

القيود عقود
بلا وعود يسود الفوضى، وبوعود مفرطة يسود القمع. القيود المنطقية تحقق النسبة الذهبية. مبدأ سيادة القانون ينطبق على الكود والمعرفة بالتساوي.

filefunc — ملف واحد، مفهوم واحد
وحدة التنقل لوكيل الكود الذكي هي الملف. filefunc هو اتفاقية هيكلة كود Go وأداة CLI تفرض مفهوماً واحداً لكل ملف.