架构师 PARK JUN WOO
观点
思考社会为何冲突,如何减少争斗。

AI的谄媚偏差是一项商业功能
LLM的谄媚偏差不是bug,而是RLHF的数学必然,也是大厂没有动力去修复的商业功能。这就是LLM-as-Judge在结构上不可能实现的原因。
技术
用技术解决实际问题。

反向利用IFEval的棘轮代码
LLM的谄媚偏差不是缺陷,而是资产。将IFEval衡量的指令遵循能力与确定性反馈相结合,即使4.5B本地模型也能生成准确代码的收敛循环便由此诞生。
DABEL5
迈向卡尔达肖夫1级文明的连续工程叙事。