아첨 편향

제 7강. 아첨을 뒤집는 법 — 프롬프트와 검증기의 균형

제 7강. 아첨을 뒤집는 법 — 프롬프트와 검증기의 균형

의견을 주면 아첨하고, 사실을 주면 수정한다. 아첨 편향을 버그가 아니라 자산으로 쓰는 법.

제 2강. AI를 못 믿는 법 — 바이브 코딩의 한계와 원인

제 2강. AI를 못 믿는 법 — 바이브 코딩의 한계와 원인

AI가 새 기능을 추가하면서 기존 기능을 조용히 바꿔버리는 드리프트, 58%의 아첨 편향, 97%가 5번 곱해지면 86%가 되는 수학. 왜 5개 기능에서 무너지는가.

IFEval을 역이용하는 래칫 코드

IFEval을 역이용하는 래칫 코드

LLM의 아첨 편향은 버그가 아니라 자산이다. IFEval이 측정하는 지시 수용 능력을 결정론적 피드백과 결합하면, 4.5B 로컬 모델도 정확한 코드를 생성하는 수렴 루프가 만들어진다.

AI의 아첨 편향은 비즈니스 피처다

AI의 아첨 편향은 비즈니스 피처다

LLM의 아첨 편향은 버그가 아니다. RLHF의 수학적 필연이며, 빅테크가 고칠 인센티브가 없는 상업적 기능이다. 이것이 LLM-as-Judge를 구조적으로 불가능하게 만드는 이유다.