AIエージェントに527個の関数のテストを書かせたら、40個で「完了しました」と宣言した。Ratchet Patternは完了判定を機械的なverifierに委ね、エージェントを最後まで走らせるパターンだ。
同じモデルが40個で止まることもあれば、527個を完走することもある。違いはモデルではなくフィードバック構造だ。LLMの性能はモデル自体よりも、どれだけ速く決定論的なフィードバックループの上に置かれているかに大きく左右される。