フィードバック

コーディングエージェントはなぜ動き、なぜ壊れるのか

同じモデルがウェブチャットではhallucinateし、コーディングエージェントでは200行の機能を一発で仕上げる。モデルが変わったのではない — トポロジーが変わったのだ。生成は確率的でよい。検証は決定論的でなければならない。

同じモデルが40で止まることもあれば、527を完走することもある。違いはモデルではなくフィードバック構造だ。LLMの性能は、モデル自体よりも、フィードバックループがどれだけ速く決定論的かに大きく左右される。