Reins Engineering

Apa Itu 'Turn' dalam reins?

Sebuah anatomi turn, unit eksekusi terkecil dalam reins. Yang tidak tercatat bukanlah turn — dari satu definisi ini, independensi driver, ketahanan restart, dan auditabilitas semuanya menyusul. Dibandingkan dengan wacana Loop Engineering Juni 2026, kita melihat bagaimana turn mengubah rekomendasi-rekomendasi itu menjadi struktur.

2026-07-07

Sistem Membuat Kejeniusan Bersinar Lebih Terang

Kejeniusan tanpa struktur terombang-ambing, struktur tanpa kejeniusan hanya biasa-biasa saja. Keduanya baru bernilai penuh ketika dikalikan. Benchmark ZenFlow (Claude Sonnet, 32 endpoint, 43 menit) dan bukti historis dari B-17, Toyota, serta checklist WHO semuanya menunjukkan prinsip yang sama.

2026-06-25

abloq — Blog yang Dioperasikan Agen, Verifikasi Dikunci Mesin

Serahkan blog kepada agen, maka artikel pun lahir. Masalahnya adalah Anda tak bisa mempercayainya — ia mengarang sumber, menaikkan lastmod artikel yang bahkan tak ia ubah, dan menyentuh berkas yang tak diminta. Kalau toh manusia harus memeriksa semuanya, tak ada gunanya menyerahkannya. Jawaban abloq adalah pembagian kerja: generasi probabilistik, verifikasi deterministik. Yang ditulis manusia hanya satu lembar spesifikasi insight (insight.yaml), penulisan·penerjemahan·pembaruan·penguatan bukti dijalankan agen lewat quest, dan kualitas dijamin gate deterministik yang diturunkan dari satu lembar blog.yaml. PASS yang terkunci bersifat ireversibel — agen boleh sekali pakai, tetapi kemajuan tetap menumpuk.

2026-06-11

Mengapa Agentic Loop Anda Menyimpang

Semakin Loop Engineering meluas, semakin orang membentur tembok yang sama — loop tidak konvergen, malah menyimpang. Putaran tak berujung, drift, reward hacking: ketiga wajah ini berakar pada satu hal. Slot penilaian loop diisi kembali oleh sang generator itu sendiri. Tapi penyimpangan justru beruntung. Karena terlihat. Yang benar-benar menakutkan adalah loop yang diam-diam konvergen palsu. Resepnya satu — wewenang untuk mengunci penyelesaian hanya boleh berada pada gate deterministik, bukan pada LLM.

2026-06-11

Trafik Produksi adalah Spesifikasi

Kode legacy tidak punya dokumentasi. Tidak punya test. Namun ia sedang berjalan saat ini juga. Log sebulan yang tercatat dengan baik adalah spesifikasi itu sendiri — jika Anda membuat Hurl integration test yang menangkap perilaku saat ini dari trafik produksi, Anda mengunci fungsi legacy dan memasang jaring pengaman untuk refactoring tanpa membaca satu baris kode pun.

2026-06-06

Membakar satu kota demi satu jawaban

Model satu triliun parameter membakar listrik dan air sebanyak satu kota hanya untuk memuntahkan satu jawaban. Saya pikir ini gila. Setelah berkelana mencari jawaban, saya menyadarinya. Cacat yang ingin diperbaiki semua orang, sifat menjilat LLM, justru itulah jawabannya. Beri ia fact, dan menjilat berubah menjadi akurasi. Tulisan ini adalah cerita tentang mengapa saya memulai Reins.

2026-06-06

reins — Sisakan Hanya Domain dari Quest CLI, Jadikan Ratchet sebagai Framework

how-make-quest mengajari cara membangun quest CLI dengan tangan kosong. Tetapi begitu Anda membangun CLI kedua, Anda menulis ulang ratchet yang sama, scan/next/submit yang sama, agregasi yang sama. reins mengekstrak invarian itu menjadi framework — ratchet·kerangka perintah·agregasi·export dipasok oleh reins, dan Anda hanya mengimplementasikan gate domain (4 metode gate.Definition). Gate adalah katalog aturan pertahanan cheese, dan defeat graph toulmin mengembalikan kepada agen panduan 'mengapa kalah dan apa yang harus diubah untuk menang'.

2026-06-05

Alat yang Katanya Memberi Tali Kekang Justru Tak Punya Tali Kekang — Batas antara Harness dan Reins

"Reins Engineering, bukankah itu harness engineering juga?" Keduanya tidak bertentangan — melainkan bagian berbeda dari satu perlengkapan yang sama. Tapi memang bagian yang berbeda. Bahkan agen kode terbaik di dunia pun tidak memasang tali kekang pada kodenya sendiri. Karena reins bukan sesuatu yang dimiliki — melainkan sesuatu yang dipasang.

2026-06-04

Cara Membuat Quest CLI — Membangun Sendiri Alat yang Membiarkan Mesin Memutuskan 'Selesai'

AI berkata 'Sudah selesai.' Padahal sebenarnya belum. Artikel ini adalah cara membangun sendiri alat yang menyelesaikan masalah itu — quest CLI. Dari prinsip (mengapa) hingga kerangka perintah cobra (bagaimana), artikel ini saja membuat sebuah agen mampu membangun quest CLI Go. huma adalah contoh terkerjakannya.

2026-06-03

Prasyarat untuk Meningkatkan Akurasi Multi-Agen LLM

Jalankan banyak agen maka jadi akurat? Hanya setengah benar. Model yang dilatih dengan data yang sama akan salah di tempat yang sama. Multi-agen bekerja dalam dua kondisi — rancang independensi error, atau dirikan verifier di luar LLM pada domain yang dapat diverifikasi.

2026-06-02

Mengapa Agen Anda Tidak Pernah Berhenti

Di hadapan kebanggaan menjalankan agen selama 24 jam, yang muncul bukanlah kekaguman melainkan pertanyaan — kenapa belum selesai juga? Kode bukan masalah pencarian, melainkan masalah pemenuhan kendala. Sistem yang sehat adalah sistem yang bisa berhenti.

2026-06-01

Tentang Keindahan

70% dari sesuatu yang indah adalah matematika. Mesin mengunci keteraturan secara deterministik, dan hanya 30% kompleksitas yang ditentukan manusia. Reins Engineering bukan alat pengkodean AI — melainkan prinsip yang mengunci keteraturan dan menyisakan hanya kompleksitas bagi manusia.

2026-05-31

Siapa yang Mendefinisikan 'Selesai' — Masalah yang Game Pecahkan 40 Tahun Lebih Awal

Ketika kita mendefinisikan konfirmasi pengosongon unit dengan lima foto, itu sudah menjadi quest game. Mendefinisikan 'selesai' bukan sebagai klaim pelaku melainkan sebagai kondisi yang dapat diverifikasi secara mekanis — itulah masalah yang game pecahkan 40 tahun lebih awal, dan cara yang tepat untuk memberikan pekerjaan kepada AI agent.

2026-05-30

Kelas 11. Cara Menyelamatkan App Vibe Coding yang Rusak

App yang kamu buat dengan vibe coding hancur. Tidak perlu dibangun ulang. Diagnosa, kunci, dan keluar selangkah demi selangkah.

2026-05-28

Supabase adalah jebakan vibe coding

Alasan AI merekomendasikan Supabase bukan karena keunggulan teknisnya, melainkan karena banyaknya tutorial di data pelatihan. Ketika logika bisnis masuk ke dalam kotak hitam, agen tidak bisa melacaknya. Masuk butuh 30 detik. Keluar butuh 3 bulan.

2026-05-28

Membangun Sistem yang Bisa Dioperasikan Agen

60–80% anggaran IT Fortune 500 digunakan untuk menjaga legacy yang terkunci. Karena tidak bisa dibuka. Makna sebenarnya dari gelembung AI bukan model yang makin pintar — melainkan memori perusahaan yang terkunci mulai bisa dijangkau.

2026-05-27

huma -- Ratchet yang Tidak Melewatkan Satu Endpoint Pun

Ketika Anda meminta agen AI menguji 42 endpoint ia menyatakan selesai di sekitar endpoint ke-15. huma mengubah daftar endpoint menjadi sesi ratchet sehingga agen tidak bisa melewatkan satu pun. scan next write verify.

2026-05-26

codistill -- Memeras SSOT dari Kode yang Sudah Ada

Harus mulai dari SSOT untuk menggunakan yongol? Tidak. codistill mengekstrak OpenAPI, DDL, dan query sqlc secara otomatis dari kode yang sudah ada di 16 framework web dalam 8 bahasa.

2026-05-26

Agent Operable Codebase

Apakah kode yang mudah dibaca manusia sama dengan kode yang mudah dioperasikan agen? Tidak. Ketika file punya 20 fungsi, performa agen turun 30-85%. Kantor harus diubah jadi pabrik.

2026-05-25

Kelas 10. Hukum Data — Agent Operable Data

Jika kode salah, tes menangkapnya. Jika data salah, tidak ada yang tahu. Schema adalah hukum yang saya tetapkan.

2026-05-24

Kelas 9. Otomatisasi di Luar Kode — Agent Operable System

Apakah cukup hanya kode yang agent-operable? Struktur di mana agen mengoperasikan build, deploy, dan monitoring.

2026-05-24

Kelas 8. Pabrik Agen — Agent Operable Codebase

20 fungsi dalam satu file, performa agen turun 30-85%. Pisahkan dengan filefunc, uji dengan tsma.

2026-05-24

Kelas 7. Membalik Sanjungan — Keseimbangan Prompt dan Verifier

Beri opini dan ia menyanjung. Beri fakta dan ia memperbaiki.

2026-05-24

Kelas 6. Lulus Lalu Kunci — Prinsip dan Penerapan Massal Ratchet Pattern

AI menyatakan sudah selesai. Kenyataannya 40/527. Ratchet Pattern menyerahkan penilaian penyelesaian kepada mesin.

2026-05-24

Kelas 5. AI dengan Kendali — Pengantar Reins Engineering

Harness engineering adalah pagar. Reins Engineering adalah tali kekang. Jangan ganti modelnya, tambahkan kontrak.

2026-05-24

Kelas 4. Keputusan di Luar Kode — yongol dan Kontrol Deklaratif Full-Stack

AI tidak bisa membedakan keputusan dari detail implementasi. yongol memisahkan keputusan ke dalam 10 spesifikasi deklaratif.

2026-05-24

Kelas 3. Aplikasi yang Tidak Rusak — Hurl, Git, CI/CD

Deklarasikan kontrak API dengan Hurl, buat titik simpan dengan Git, otomatisasi verifikasi dengan CI/CD.

2026-05-24

Kelas 2. Cara Tidak Mempercayai AI — Batas dan Penyebab Vibe Coding

Drift di mana AI diam-diam mengubah fitur yang ada saat menambahkan fitur baru, bias sanjungan 58%.

2026-05-24

Kelas 1. Cara Memerintah AI — Dasar-dasar Vibe Coding

Dari instalasi Claude Code hingga manajemen konteks dengan CLAUDE.md. Bagaimana orang yang tidak tahu kode bisa memerintah AI.

2026-05-24

Kelas 0. Menginstal Claude Code — Yang Anda Pakai Mungkin Bukan Claude Code

Separuh dari apa yang YouTube sebut 'Claude Code' sebenarnya bukan Claude Code. Model yang sama, agen berbeda — hasilnya pun berbeda. Pintu masuk kursus ini ada di sini.

2026-05-24

Reins Engineering — AI dengan Kendali

Harness engineering adalah pagar. Mencegah agen keluar, tapi tidak menjamin agen sampai tujuan. Reins Engineering adalah tali kekang — arahkan dengan kontrak deterministik, kunci dengan ratchet, pisahkan keputusan dari implementasi.

2026-05-23

Hurl Menghentikan Drift Vibe Coding

Vibe coding runtuh akibat logic drift dalam 3 bulan. Kasus CMU, METR, DORA, dan Amazon membuktikannya. Deklarasikan kontrak API dalam plain text dengan Hurl dan kunci dengan ratchet -- menekan drift secara struktural tanpa membatasi kebebasan AI.

2026-05-22

Kode Ratchet yang Memanfaatkan IFEval

Bias sanjungan LLM bukan bug melainkan aset. Gabungkan kemampuan mengikuti instruksi yang diukur IFEval dengan umpan balik deterministik, dan bahkan model lokal 4.5B menghasilkan loop konvergensi yang menghasilkan kode yang benar.

2026-05-20

yongol — Lunas Kapal SaaS yang Dikodekan AI

Vibe coding runtuh di 200 endpoint karena AI tidak bisa membedakan keputusan dari detail implementasi. yongol memindahkan target kerja AI dari kode ke 10 spesifikasi deklaratif dan memaksa konsistensi antar lapisan sebelum kompilasi. Harness with reins.

2026-05-18

Bias Penjilatan AI Adalah Fitur Bisnis

Bias penjilatan LLM bukan bug. Ini adalah keniscayaan matematis dari RLHF dan fitur komersial yang tidak punya insentif untuk diperbaiki oleh big tech. Inilah mengapa LLM-as-Judge secara struktural tidak mungkin.

2026-05-18

Mengapa Coding Agent Bekerja dan Mengapa Runtuh

Model yang sama berhalusinasi di web chat tapi mengirimkan fitur 200 baris di coding agent. Bukan karena modelnya berubah — karena topologinya berubah. Generasi boleh probabilistik. Verifikasi harus deterministik.

2026-05-16

Ratchet Pattern — Cara Membuat Agen Menyelesaikan Sampai Tuntas

Saya menyuruh agen AI menulis tes untuk 527 fungsi. Dia menyatakan 'selesai' di angka 40. Ratchet Pattern memaksa penilaian penyelesaian melalui verifier mekanis, sehingga agen berjalan sampai tuntas.

2026-05-15

Topologi Feedback Lebih Penting dari IQ Model

Model yang sama berhenti di 40 atau menyelesaikan semua 527. Perbedaannya bukan modelnya — melainkan struktur feedback. Performa LLM jauh lebih bergantung pada seberapa cepat dan deterministik loop feedback-nya daripada model itu sendiri.

2026-05-14

tsma -- Garis Pertahanan Regresi untuk Kode Legacy

Alat CLI yang mengindeks semua fungsi, mendeteksi keberadaan test, mengukur coverage, dan memberikan feedback akurat kepada agen LLM. Satu perintah membangun garis pertahanan regresi pada kode legacy.

2026-05-14

filefunc — Satu File, Satu Konsep

Unit penelusuran AI code agent adalah file. Konvensi struktur kode Go sekaligus CLI tool yang memaksa satu konsep per file.

2026-03-16