同じモデルが40個で止まることもあれば、527個を完走することもある。違いはモデルではなくフィードバック構造だ。LLMの性能はモデル自体よりも、どれだけ速く決定論的なフィードバックループの上に置かれているかに大きく左右される。