阿谀偏差

烧掉一座城,只为换来一个答案

烧掉一座城,只为换来一个答案

一个万亿参数的模型,为了吐出一个答案,烧掉相当于一座城市的电与水。我觉得这疯了。在四处寻找答案的途中我才明白:大家都想修掉的那个缺陷,LLM 的阿谀,恰恰就是答案。喂给它 fact,阿谀就变成了准确率。这篇文章,讲的是我为什么开始做 Reins。