给意见就谄媚,给事实就修正。如何将谄媚偏差从缺陷变为资产。
LLM的谄媚偏差不是bug,而是RLHF的数学必然,也是大厂没有动力去修复的商业功能。这就是LLM-as-Judge在结构上不可能实现的原因。