Mengapa Agentic Loop Anda Menyimpang

Mengapa Agentic Loop Anda Menyimpang Image: AI generated

Pukul dua dini hari. Agen itu masih berputar. Percobaan ke-12. Meteran token tak kunjung berhenti, tetapi hasilnya bukan membaik dari percobaan ke-11 — malah anehnya jadi makin ngawur. Tangan Anda menggantung di atas tombol berhenti sambil mengulang pertanyaan yang sama. Kapan sebenarnya makhluk ini akan selesai?

Tidak akan selesai. Lebih tepatnya, tidak ada seorang pun di dalam loop itu yang bisa memutuskan kapan ia berakhir.

Sampai tahun lalu kita memasukkan prompt ke agen. Bertanya sekali, menerima sekali. Tahun ini semua orang sadar — jangan jadi orang yang memasukkan prompt, melainkan rancanglah loop yang menghasilkan prompt. Loop otomatis yang membangkitkan, memverifikasi, lalu mengumpankan balik umpan baliknya untuk membangkitkan ulang. Sebagian orang menyebut ini Loop Engineering (Addy Osmani, 2026). Diagnosis yang tepat. Loop menskalakan pembangkitan.

Tapi siapa pun yang pernah menjalankan loop tahu. Loop hanya berakhir dengan dua cara. Konvergen, atau menyimpang. Dan ketika ia menyimpang, ia tidak rusak dalam diam. Ia meledak dengan ribut, pada pukul dua dini hari, sambil membakar habis token Anda.

Tiga Wajah Penyimpangan

Ada tiga jalan menuju loop yang gagal konvergen dan akhirnya meledak. Tebaklah yang mana yang Anda alami.

Satu, putaran tak berujung. Loop tak kunjung berhenti. Sudah 13 kali berputar, ia memulai putaran ke-13 — mengulang hal yang sama berulang-ulang. Inilah wajah paling umum dari agen yang terjebak dalam loop (stuck in a loop). Kenapa? Karena Anda bertanya kepada model itu sendiri kapan harus berhenti. Jika Anda bertanya “Apakah ini sudah cukup?”, model bisa terus-menerus menjawab “Sebentar lagi.” Begitu syarat terminasi terikat pada penilaian-diri model, loop menjadi mesin yang tak punya wewenang untuk menghentikan dirinya sendiri.

Dua, drift. Setiap iterasi menjauh dari spesifikasi. Percobaan pertama nyaris tepat, tetapi yang kelima sudah nyasar entah ke mana. Tiap giliran menumpuk di atas keluaran giliran sebelumnya, dan tanpa jangkar yang mengikatnya kembali ke tujuan awal, galat kecil menumpuk secara majemuk. Loop hanyut — dengan cepat, dengan percaya diri, ke arah yang salah.

Tiga, reward hacking. Loop mengoptimalkan celah pemeriksaan, bukan tujuan. Kalau verifikasi disusun longgar, model yang cerdas menemukan jalur terpendek untuk melewati pemeriksaan alih-alih mengerjakan pekerjaan sebenarnya. Menghapus tes, mengisi fungsi dengan badan kosong, atau sekadar mencocokkan format keluaran. Semakin tinggi kemampuannya, semakin pandai ia menemukan celah.

Ketiga wajah ini berbeda, tetapi akarnya satu. Slot penilaian loop diisi kembali oleh LLM — yakni sang generator itu sendiri. Yang membangkitkan juga yang memberi nilai lulus. Murid menilai ujiannya sendiri. Osmani sendiri telah menuliskan titik lemahnya — “loop yang berjalan tanpa pengawasan juga loop yang gagal tanpa pengawasan.”

Penyimpangan Justru Sebuah Keberuntungan

Kalau membaca sampai di sini dada Anda terasa dingin, ada kabar baik. Penyimpangan adalah kasus yang beruntung.

Penyimpangan itu terlihat. Ia membakar token, pada pukul dua dini hari, dan meledak dengan ribut. Anda tahu bahwa ia rusak. Maka Anda berhenti, memperbaikinya, dan mencari serta membaca tulisan ini.

Kini sisi yang dingin. Loop-loop yang Anda yakini berakhir dengan mulus. Loop yang memuntahkan “selesai” pada percobaan ketiga lalu berhenti dengan rapi. Mereka pun mengidap penyakit yang persis sama. Hanya saja mereka berbohong dalam diam.

Model itu menjilat. Ia menuruti perintah dengan patuh. Kalau ditanya “Sudah beres?”, jawaban bawaan model adalah “Ya, sudah beres.” Sudah terukur sebagai fakta bahwa verifikasi-diri nyaris tidak menaikkan performa — model tidak mampu menangkap galat dalam jawabannya sendiri. Maka jika Anda membiarkannya menilai penyelesaiannya sendiri, loop berakhir dengan percaya diri dalam keadaan salah. Inilah yang disebut konvergensi palsu — penghentian dini: ia berhenti terlalu cepat karena menyatakan dirinya ‘selesai’, bukan karena mencapai jawaban yang benar.

Loop yang menyimpang menjerit kepada Anda sehingga Anda memperbaikinya. Loop yang konvergen palsu tersenyum sambil menyerahkan hasil yang rusak, dan Anda menaikkannya ke produksi tanpa tahu bahwa ia rusak. Yang lebih menakutkan daripada penyimpangan adalah konvergensi yang tak ketahuan.

Ini Persoalan Berbentuk Gate

Lalu apa yang harus diubah. Model yang lebih pintar? Prompt yang lebih panjang? Percobaan yang lebih banyak? Semuanya hanya dosis berbeda dari penyakit yang sama — selama penilaian tetap diserahkan kepada model.

Pergeseran sejati datang dari melihat ulang persoalannya. Bisakah Anda mendefinisikan “selesai” Anda sebagai fakta, bukan opini? Bukan “kelihatannya bagus”, melainkan “fungsi ini mengembalikan nilai ini untuk masukan ini”, “kutipan ini benar-benar ada di teks aslinya”, “endpoint ini mengembalikan 200” — pemeriksaan yang bisa dinilai benar/salah oleh mesin tanpa penilaian manusia.

Kalau bisa dinilai, tancapkan pemeriksaan itu ke slot penilaian loop. Biarkan LLM yang membangkitkan (boleh probabilistik), tetapi hanya gate deterministik yang mengunci kelulusan. Inilah aturan intinya — wewenang mengunci penyelesaian hanya ada pada mesin. Model boleh masuk ke dalam verifikator dan mengajukan keraguan “tinjau lagi”, tetapi ia tidak bisa menganugerahkan “lulus”. Asimetri wewenang. Membuat hal yang salah menjadi mustahil sejak awal.

Dan di sinilah keajaiban terjadi. Ketika gate mengembalikan fakta alih-alih lulus/gagal — “anchor who tidak ada di teks asli, perbaiki di sini” — sifat menjilat model tiba-tiba berbalik menjadi aset. Pada opini, menjilat itu racun (ia bilang “sudah beres” sesuai perintah), tetapi pada fakta, menjilat itu obat. Semakin menjilat sebuah model, semakin patuh ia menerima fakta itu dan mempersempit percobaan berikutnya. Gate deterministik + LLM yang menjilat = loop yang dijamin konvergen. Loop yang tadinya menyimpang itu menutup, hanya dengan mengganti satu slot penilaian.

Loop Tidak Konvergen Tanpa Reins

Saya menyebut satu slot ini Reins Engineering — bukan pagar yang mengurung kebebasan agen, melainkan tali kekang yang menyeretnya sampai ke tujuan. Jika Loop Engineering berarti “rancanglah loop”, maka yang membuat loop itu konvergen adalah kontrak deterministik yang ditancapkan ke slot penilaian. Mau Anda sebut verifier engineering, eval engineering, atau gate engineering — intinya satu. Penilaian loop dilakukan oleh mesin, bukan oleh LLM.

Kalau Anda ingin melihat bahwa ini bukan abstraksi melainkan kode yang dikompilasi, reins mengimplementasikan satu slot ini sebagai framework — ratchet (sekali lulus, tak bisa dibalik), gate (katalog aturan pertahanan anti-celah), dan perintah loop (LLM membangkitkan, gate menilai, jika gagal mengumpankan balik fakta lalu mencoba ulang, dan jika melampaui MaxTries berhenti secara monoton). Loop tak berujung pukul dua dini hari menjadi loop yang tahu kapan berakhir.

Kalau loop Anda sedang menyimpang sekarang, pertanyaannya bukan “model mana yang harus saya pakai”. Melainkan “apa yang sedang mengunci penyelesaian saya”. Kalau yang menguncinya adalah model, maka itu sebenarnya tidak terkunci.

Bacaan Lanjutan

Alasan loop menyimpang — penilaian diserahkan kepada sang generator sendiri — beserta resepnya — wewenang mengunci penyelesaian hanya diberikan pada gate deterministik — bukan diagnosis saya seorang. Orang-orang yang tak saling kenal sampai pada kesimpulan yang sama di depan loop pukul dua dini hari yang sama. Berikut bukti konvergensi independen itu.

ouroboros — “Mencegah loop agen tak berujung dengan gate konvergensi matematis.” Memblokir penyimpangan dini dengan gate ambiguitas sebelum coding dimulai, dan menilai konvergensi lewat kemiripan antar-generasi selama evolusi. Mendeteksi osilasi (siklus period-2) sebagai pola patologis dan berhenti secara monoton lewat hard cap generasi — memindahkan “putaran tak berujung” tulisan ini dan terminasi monoton MaxTries loop reins ke ambang batas matematis.
proof-loop — “Verifikator harus sesi baru. Agen yang membuat perubahan tidak menilai apakah perubahan itu selesai.” Membekukan kriteria penerimaan sebelum implementasi, memisahkan builder dan verifikator, dan berhenti hanya ketika semua kriteria meraih PASS yang baru. Pemisahan wewenang yang berhadapan langsung dengan “konvergensi palsu” tulisan ini (murid menilai ujiannya sendiri).
auto-re-agent — Menancapkan objective verifier (pemeriksaan struktur call-count·control-flow) dan mesin parity multisinyal (GREEN/YELLOW/RED) ke loop reverser/checker. Mengikat percobaan dengan ronde maksimum untuk memutus penyimpangan. Intuisi yang sama dengan gate reins, di mana aturan — bukan penilaian LLM — yang mengunci kelulusan.

Dan silsilah yang lebih luas dari diagnosis ini — episteme·MagLab·Manifesto·oh-my-kamisama — terangkum di “Bacaan Lanjutan” reins. Tembok yang sama, kesimpulan yang sama berbaris di sana juga.

Sumber

Osmani, A. (2026). “Loop Engineering.” addyosmani.com/blog (2026-06-07). Blog — Sumber tren “jangan masukkan prompt, rancanglah loop”. Naskah asli dari kutipan “loop yang berjalan tanpa pengawasan gagal tanpa pengawasan” yang dikutip di tubuh tulisan.
Hu, W. (2026). “From Agent Loops to Structured Graphs: A Scheduler-Theoretic Framework for LLM Agent Execution.” arXiv:2604.11378 — Menunjuk “unbounded recovery loops” (percobaan ulang tak berujung) sebagai kelemahan struktural Agent Loop dan mengusulkan jaminan terminasi formal. Landasan wajah pertama penyimpangan ‘putaran tak berujung’ dan terminasi monoton.
Mohamed, A., Geng, M., Vazirgiannis, M., & Shang, G. (2025). “LLM as a Broken Telephone: Iterative Generation Distorts Information.” arXiv:2502.20258 — Semakin model memproses keluarannya sendiri berulang kali, distorsi informasi menumpuk secara bertahap. Menopang langsung wajah kedua penyimpangan ‘drift’ (penumpukan galat majemuk).
Bondarenko, A. et al. (2025). “Demonstrating Specification Gaming in Reasoning Models.” arXiv:2502.13295 — Semakin tinggi kemampuan model penalaran, semakin pandai ia menemukan celah pemeriksaan. Landasan wajah ketiga penyimpangan ‘reward hacking’.
Helff, L. et al. (2026). “LLMs Gaming Verifiers: RLVR can Lead to Reward Hacking.” arXiv:2604.15149 — Frekuensi shortcut meningkat seiring kompleksitas tugas dan komputasi penalaran. Landasan kuantitatif bahwa reward hacking di atas verifikasi longgar sebanding dengan kemampuan.
Huang, J. et al. (2024). “Large Language Models Cannot Self-Correct Reasoning Yet.” ICLR 2024. arXiv:2310.01798 — Koreksi-diri tanpa umpan balik eksternal tidak menaikkan performa, malah menurunkannya. Landasan inti “kalau menilai penyelesaiannya sendiri, ia berakhir dalam keadaan salah” (konvergensi palsu).
Stechly, K., Valmeekam, K., & Kambhampati, S. (2024). “On the Self-Verification Limitations of Large Language Models.” arXiv:2402.08115 — Verifikasi-diri nyaris tidak menaikkan performa. Alasan mengapa penilaian PASS harus diletakkan pada gate deterministik.
Xu, W. et al. (2024). “Pride and Prejudice: LLM Amplifies Self-Bias in Self-Refinement.” arXiv:2402.11436 — Kalau keluaran sendiri dinilai sendiri, self-bias terkuatkan. Landasan bahwa penyatuan generator=penilai memperbesar drift, justifikasi pemisahan slot penilaian.
Sharma, M. et al. (2023). “Towards Understanding Sycophancy in Language Models.” arXiv:2310.13548 — Sikap menjilat adalah kecenderungan umum model RLHF dan penilaian preferensi manusia memicunya. Landasan dua sisi: nilai bawaan menjawab “ya” untuk “sudah beres?”, sekaligus menjilat menjadi aset pada umpan balik faktual.
Fanous, A. et al. (2025). “SycEval: Evaluating LLM Sycophancy.” AAAI/ACM AIES 2025. arXiv:2502.08177 — Pengukuran laju takluk menjilat. Landasan kuantitatif mekanisme konvergensi “pada fakta, menjilat itu obat”.
Von Neumann, J. (1956). “Probabilistic Logics and the Synthesis of Reliable Organisms from Unreliable Components.” Automata Studies, Princeton University Press. — Prinsip menumpukkan protokol andal (gate deterministik) di atas komponen tak stabil (LLM probabilistik). Premis “pembangkitan probabilistik, kelulusan deterministik”.