Reins Engineering

Hurl Menghentikan Logic Drift pada Vibe Coding

Hurl Menghentikan Logic Drift pada Vibe Coding

Vibe coding runtuh menjadi logic drift dalam tiga bulan. CMU, METR, DORA, dan Amazon membuktikannya. Deklarasikan kontrak API dalam plain text dengan Hurl dan kunci dengan ratchet — drift ditekan secara struktural tanpa membatasi kebebasan AI.

Kode Ratchet yang Memanfaatkan IFEval

Kode Ratchet yang Memanfaatkan IFEval

Bias penjilatan LLM bukan bug, melainkan aset. Jika kemampuan penerimaan instruksi yang diukur IFEval digabungkan dengan umpan balik deterministik, bahkan model lokal 4.5B pun membentuk loop konvergensi yang menghasilkan kode akurat.

yongol — Lunas Kapal SaaS yang Dikodekan AI

yongol — Lunas Kapal SaaS yang Dikodekan AI

Vibe coding runtuh di 200 endpoint karena AI tidak bisa membedakan keputusan dari detail implementasi. yongol memindahkan beban kerja AI dari kode ke 10 spesifikasi deklaratif dan memaksakan konsistensi lintas lapisan sebelum kompilasi. Harness with reins.

Bias Penjilatan AI Adalah Fitur Bisnis

Bias Penjilatan AI Adalah Fitur Bisnis

Bias sycophancy pada LLM bukan bug. Ini adalah keniscayaan matematis dari RLHF, dan fitur komersial yang tidak memiliki insentif untuk diperbaiki oleh big tech. Inilah mengapa LLM-as-Judge secara struktural tidak mungkin.

Mengapa Coding Agent Bekerja dan Mengapa Runtuh

Mengapa Coding Agent Bekerja dan Mengapa Runtuh

Model yang sama berhalusinasi di web chat tetapi bekerja di coding agent. Bukan karena modelnya berbeda, melainkan topology-nya yang berbeda. Generasi boleh probabilistik. Verifikasi harus deterministik.

Ratchet Pattern — Cara Membuat Agen Menyelesaikan Sampai Tuntas

Ratchet Pattern — Cara Membuat Agen Menyelesaikan Sampai Tuntas

Saya menyuruh agen AI menulis tes untuk 527 fungsi. Dia menyatakan 'selesai' di angka 40. Ratchet Pattern memaksa penilaian penyelesaian melalui verifier mekanis, sehingga agen berjalan sampai tuntas.

Topologi Feedback Lebih Penting dari IQ Model

Topologi Feedback Lebih Penting dari IQ Model

Model yang sama bisa berhenti di 40 atau menyelesaikan 527. Perbedaannya bukan pada model, melainkan pada struktur feedback. Performa LLM lebih ditentukan oleh seberapa cepat dan deterministik feedback loop yang mendasarinya daripada model itu sendiri.

tsma — Garis Pertahanan Regresi untuk Kode Legacy

tsma — Garis Pertahanan Regresi untuk Kode Legacy

Alat CLI yang mengindeks semua fungsi, mendeteksi keberadaan test, mengukur coverage, dan memberikan feedback akurat kepada agen LLM. Satu perintah membangun garis pertahanan regresi pada kode legacy.

filefunc — Satu File, Satu Konsep

filefunc — Satu File, Satu Konsep

Unit penelusuran AI code agent adalah file. Konvensi struktur kode Go sekaligus CLI tool yang memaksa satu konsep per file.