아키텍터 박준우
생각
철학, 정치, 사회에 대해 생각합니다.

AI의 아첨 편향은 비즈니스 피처다
LLM의 아첨 편향은 버그가 아니다. RLHF의 수학적 필연이며, 빅테크가 고칠 인센티브가 없는 상업적 기능이다. 이것이 LLM-as-Judge를 구조적으로 불가능하게 만드는 이유다.
기술
문제가 있다면 해결하는 기술 아이디어를 이야기합니다.

IFEval을 역이용하는 래칫 코드
LLM의 아첨 편향은 버그가 아니라 자산이다. IFEval이 측정하는 지시 수용 능력을 결정론적 피드백과 결합하면, 4.5B 로컬 모델도 정확한 코드를 생성하는 수렴 루프가 만들어진다.
창작
소설을 연재합니다.
DABEL5
카르다쇼프 1단계 문명을 달성하기까지, 하나의 연속된 공학 서사.