谄媚偏差

第7课. 翻转谄媚 — 提示词与验证器的平衡

第7课. 翻转谄媚 — 提示词与验证器的平衡

给意见就谄媚,给事实就修正。如何将谄媚偏差从缺陷变为资产。

第2课. 如何不信任AI — 氛围编程的局限与原因

第2课. 如何不信任AI — 氛围编程的局限与原因

AI在添加新功能时悄悄修改现有功能的漂移现象、58%的谄媚偏差、97%连乘5次变成86%的数学。为什么在5个功能时崩溃。

反向利用IFEval的棘轮代码

反向利用IFEval的棘轮代码

LLM的谄媚偏差不是缺陷,而是资产。将IFEval衡量的指令遵循能力与确定性反馈相结合,即使4.5B本地模型也能生成准确代码的收敛循环便由此诞生。

AI的谄媚偏差是一项商业功能

AI的谄媚偏差是一项商业功能

LLM的谄媚偏差不是bug,而是RLHF的数学必然,也是大厂没有动力去修复的商业功能。这就是LLM-as-Judge在结构上不可能实现的原因。