Reins Engineering

Hurl이 바이브 코딩의 드리프트를 막는다
바이브 코딩은 3개월 만에 로직 드리프트로 무너진다. CMU, METR, DORA, Amazon 사례가 이를 증명한다. Hurl로 API 계약을 plain text로 선언하고 래칫으로 잠그면, AI의 자유를 제한하지 않으면서 드리프트를 구조적으로 억제한다.

IFEval을 역이용하는 래칫 코드
LLM의 아첨 편향은 버그가 아니라 자산이다. IFEval이 측정하는 지시 수용 능력을 결정론적 피드백과 결합하면, 4.5B 로컬 모델도 정확한 코드를 생성하는 수렴 루프가 만들어진다.

yongol — AI 코딩 SaaS의 용골
바이브 코딩은 200 엔드포인트에서 무너진다. AI가 결정과 구현을 구별하지 못하기 때문이다. yongol은 AI의 작업 대상을 코드에서 선언적 명세 10종으로 옮기고, 레이어 간 정합성을 컴파일 전에 강제한다. Harness with reins.

AI의 아첨 편향은 비즈니스 피처다
LLM의 아첨 편향은 버그가 아니다. RLHF의 수학적 필연이며, 빅테크가 고칠 인센티브가 없는 상업적 기능이다. 이것이 LLM-as-Judge를 구조적으로 불가능하게 만드는 이유다.

코딩 에이전트는 왜 작동하고 왜 무너지는가
같은 모델이 웹 채팅에서는 hallucinate하고 코딩 에이전트에서는 작동한다. 모델이 달라서가 아니라 topology가 달라서다. 생성은 확률적이어도 된다. 검증은 결정론적이어야 한다.

Ratchet Pattern — 에이전트가 끝까지 가게 만드는 방법
AI 에이전트에게 527개 함수의 테스트를 시켰더니 40개에서 '다 했습니다'라고 선언했다. Ratchet Pattern은 완료 판정을 기계적 verifier로 강제하여 에이전트가 끝까지 가게 만드는 패턴이다.

모델 IQ보다 피드백 토폴로지
같은 모델이 40개에서 멈추기도 하고 527개를 완주하기도 한다. 차이는 모델이 아니라 피드백 구조다. LLM의 성능은 모델 자체보다 얼마나 빠르고 결정론적인 피드백 루프 위에 놓여 있는가에 더 크게 좌우된다.

tsma — 레거시 코드의 회귀 방어선
모든 함수를 인덱싱하고, 테스트 유무를 감지하고, 커버리지를 측정하고, LLM 에이전트에게 피드백을 주는 CLI 도구. 명령어 하나로 레거시 코드에 회귀 방어선을 구축한다.

filefunc — 파일 하나에 개념 하나
AI 코드 에이전트의 탐색 단위는 파일이다. 파일 하나에 개념 하나를 강제하는 Go 코드 구조 컨벤션이자 CLI 도구.