谄媚偏差

你的智能体循环为何会发散

你的智能体循环为何会发散

随着 Loop Engineering 越来越普及，人们撞上了同一堵墙 —— 循环无法收敛，反而发散。无限空转、漂移、奖励黑客，这三张面孔的根源只有一个：把生成者本身又塞回了循环的裁决槽位。但发散反倒算运气好，因为它看得见。真正可怕的是悄悄假收敛的循环。处方只有一条 —— 把锁定「完成」的权限交给确定性的 gate，而不是 LLM。

Supabase 是 Vibe Coding 的陷阱

Supabase 是 Vibe Coding 的陷阱

AI 推荐 Supabase 的原因不是技术优越性，而是训练数据中充斥着大量教程。一旦业务逻辑进入黑盒，智能体就无法追踪。进去只需 30 秒，出来却要 3 个月。

第7课. 翻转谄媚 — 提示词与验证器的平衡

第7课. 翻转谄媚 — 提示词与验证器的平衡

给意见就谄媚，给事实就修正。如何将谄媚偏差从缺陷变为资产。

第2课. 如何不信任AI — 氛围编程的局限与原因

第2课. 如何不信任AI — 氛围编程的局限与原因

AI在添加新功能时悄悄修改现有功能的漂移现象、58%的谄媚偏差、97%连乘5次变成86%的数学。为什么在5个功能时崩溃。

反向利用IFEval的棘轮代码

反向利用IFEval的棘轮代码

LLM的谄媚偏差不是缺陷而是资产。将IFEval衡量的指令遵循能力与确定性反馈相结合，即使4.5B本地模型也能产生生成正确代码的收敛循环。

AI的谄媚偏差是一项商业功能

AI的谄媚偏差是一项商业功能

LLM的谄媚偏差不是bug。它是RLHF的数学必然，也是大型科技公司没有动力修复的商业功能。这就是LLM-as-Judge在结构上不可能实现的原因。