Teknologi

Mengapa Model Pintar Tidak Bisa Menjelaskan

Mengapa Model Pintar Tidak Bisa Menjelaskan

Model pintar berbicara dengan sulit, sementara model yang pandai menjelaskan lemah dalam penalaran. Solusinya: pisahkan keduanya. Metode konkret untuk menjalankan model komunikasi (utama) dan model penalaran (subagent) secara terpisah di Claude Code, beserta alasan mengapa struktur ini bekerja.

abloq — Blog yang Dioperasikan Agen, Verifikasi Dikunci Mesin

abloq — Blog yang Dioperasikan Agen, Verifikasi Dikunci Mesin

Serahkan blog kepada agen, maka artikel pun lahir. Masalahnya adalah Anda tak bisa mempercayainya — ia mengarang sumber, menaikkan lastmod artikel yang bahkan tak ia ubah, dan menyentuh berkas yang tak diminta. Kalau toh manusia harus memeriksa semuanya, tak ada gunanya menyerahkannya. Jawaban abloq adalah pembagian kerja: generasi probabilistik, verifikasi deterministik. Yang ditulis manusia hanya satu lembar spesifikasi insight (insight.yaml), penulisan·penerjemahan·pembaruan·penguatan bukti dijalankan agen lewat quest, dan kualitas dijamin gate deterministik yang diturunkan dari satu lembar blog.yaml. PASS yang terkunci bersifat ireversibel — agen boleh sekali pakai, tetapi kemajuan tetap menumpuk.

reins — Sisakan Hanya Domain dari Quest CLI, Jadikan Ratchet sebagai Framework

reins — Sisakan Hanya Domain dari Quest CLI, Jadikan Ratchet sebagai Framework

how-make-quest mengajari cara membangun quest CLI dengan tangan kosong. Tetapi begitu Anda membangun CLI kedua, Anda menulis ulang ratchet yang sama, scan/next/submit yang sama, agregasi yang sama. reins mengekstrak invarian itu menjadi framework — ratchet·kerangka perintah·agregasi·export dipasok oleh reins, dan Anda hanya mengimplementasikan gate domain (4 metode gate.Definition). Gate adalah katalog aturan pertahanan cheese, dan defeat graph toulmin mengembalikan kepada agen panduan 'mengapa kalah dan apa yang harus diubah untuk menang'.

Cara Membuat Quest CLI — Membangun Sendiri Alat yang Membiarkan Mesin Memutuskan 'Selesai'

Cara Membuat Quest CLI — Membangun Sendiri Alat yang Membiarkan Mesin Memutuskan 'Selesai'

AI berkata 'Sudah selesai.' Padahal sebenarnya belum. Artikel ini adalah cara membangun sendiri alat yang menyelesaikan masalah itu — quest CLI. Dari prinsip (mengapa) hingga kerangka perintah cobra (bagaimana), artikel ini saja membuat sebuah agen mampu membangun quest CLI Go. huma adalah contoh terkerjakannya.

filefunc × Hono — Kode yang Dibaca Agen dalam Sekali Lihat: dari 60 Baris Menjadi 18

filefunc × Hono — Kode yang Dibaca Agen dalam Sekali Lihat: dari 60 Baris Menjadi 18

Kami merefaktor Hono, framework produksi bintang 23k, menggunakan filefunc. Semua 4419 tes lolos. Dan saat diukur — jumlah kode yang dibaca agen ketika membuka satu konsep turun 71% dari median 60 baris menjadi 18 baris. Bukan jumlah file yang jadi kunci, melainkan 'panjang baca'.

GEO: Cara Membuat AI Mengutip Tulisan Anda

GEO: Cara Membuat AI Mengutip Tulisan Anda

Jika konten Anda tidak dikutip dalam jawaban yang dihasilkan AI, maka konten Anda tidak ada. Menurut paper GEO, kutipan sumber +30%, statistik +32%, kutipan langsung +41% peningkatan visibilitas. Infrastruktur, sitemap, Wayback Machine, kutipan paper, aktivitas sosial — lima sumbu untuk mengamankan visibilitas AI.

huma -- Ratchet yang Tidak Melewatkan Satu Endpoint Pun

huma -- Ratchet yang Tidak Melewatkan Satu Endpoint Pun

Ketika Anda meminta agen AI menguji 42 endpoint ia menyatakan selesai di sekitar endpoint ke-15. huma mengubah daftar endpoint menjadi sesi ratchet sehingga agen tidak bisa melewatkan satu pun. scan next write verify.

codistill -- Memeras SSOT dari Kode yang Sudah Ada

codistill -- Memeras SSOT dari Kode yang Sudah Ada

Harus mulai dari SSOT untuk menggunakan yongol? Tidak. codistill mengekstrak OpenAPI, DDL, dan query sqlc secara otomatis dari kode yang sudah ada di 16 framework web dalam 8 bahasa.

Hurl Menghentikan Drift Vibe Coding

Hurl Menghentikan Drift Vibe Coding

Vibe coding runtuh akibat logic drift dalam 3 bulan. Kasus CMU, METR, DORA, dan Amazon membuktikannya. Deklarasikan kontrak API dalam plain text dengan Hurl dan kunci dengan ratchet -- menekan drift secara struktural tanpa membatasi kebebasan AI.

Kode Ratchet yang Memanfaatkan IFEval

Kode Ratchet yang Memanfaatkan IFEval

Bias sanjungan LLM bukan bug melainkan aset. Gabungkan kemampuan mengikuti instruksi yang diukur IFEval dengan umpan balik deterministik, dan bahkan model lokal 4.5B menghasilkan loop konvergensi yang menghasilkan kode yang benar.

yongol — Lunas Kapal SaaS yang Dikodekan AI

yongol — Lunas Kapal SaaS yang Dikodekan AI

Vibe coding runtuh di 200 endpoint karena AI tidak bisa membedakan keputusan dari detail implementasi. yongol memindahkan target kerja AI dari kode ke 10 spesifikasi deklaratif dan memaksa konsistensi antar lapisan sebelum kompilasi. Harness with reins.

Ratchet Pattern — Cara Membuat Agen Menyelesaikan Sampai Tuntas

Ratchet Pattern — Cara Membuat Agen Menyelesaikan Sampai Tuntas

Saya menyuruh agen AI menulis tes untuk 527 fungsi. Dia menyatakan 'selesai' di angka 40. Ratchet Pattern memaksa penilaian penyelesaian melalui verifier mekanis, sehingga agen berjalan sampai tuntas.

tsma -- Garis Pertahanan Regresi untuk Kode Legacy

tsma -- Garis Pertahanan Regresi untuk Kode Legacy

Alat CLI yang mengindeks semua fungsi, mendeteksi keberadaan test, mengukur coverage, dan memberikan feedback akurat kepada agen LLM. Satu perintah membangun garis pertahanan regresi pada kode legacy.

toulmin — Mesin Aturan yang Menghitung Kontrak

toulmin — Mesin Aturan yang Menghitung Kontrak

Selama 60 tahun, mesin aturan memperlakukan objek validasi sebagai fakta (fact). toulmin memperlakukannya sebagai klaim (claim). Model argumentasi Toulmin diimplementasikan sebagai mesin aturan Go.

filefunc — Satu File, Satu Konsep

filefunc — Satu File, Satu Konsep

Unit penelusuran AI code agent adalah file. Konvensi struktur kode Go sekaligus CLI tool yang memaksa satu konsep per file.

Feature Chain — Melacak seluruh stack dengan satu operationId

Feature Chain — Melacak seluruh stack dengan satu operationId

File apa saja yang harus disentuh untuk memodifikasi satu fitur? Feature Chain menerima satu operationId dan secara otomatis mengekstrak seluruh ruang lingkup — spesifikasi API, skema DB, kebijakan otorisasi, diagram status, implementasi fungsi, skenario pengujian, dan frontend.

whyso — Apa yang Tidak Ditunjukkan git blame

whyso — Apa yang Tidak Ditunjukkan git blame

git blame menunjukkan siapa, kapan, dan apa yang diubah. whyso menunjukkan mengapa diubah. Sebuah alat yang secara otomatis mengekstrak riwayat perubahan per file dari data sesi Claude Code.

Solusi Perubahan Iklim Ada di Luar Angkasa? Ya, Serius.

Solusi Perubahan Iklim Ada di Luar Angkasa? Ya, Serius.

Memasang tirai matahari di antara Matahari dan Bumi untuk membalikkan iklim. Keluar dari pabrik cermin Dyson yang sama, cukup hilangkan lapisannya. Terbang sendiri tanpa pendorong. Cabut, kembali normal. Hitungannya masuk.

SSaC — Service Sequences as Code

SSaC — Service Sequences as Code

Konsep independen bahasa yang mendekomposisi alur bisnis di dalam fungsi layanan menjadi blok deklaratif (sequence). Cukup deklarasikan what dengan 10 tipe tetap, dan codegen yang mengisi how.

Berpikir dengan AI dari Prinsip Pertama: Metode 5 Langkah dengan Studi Kasus

Berpikir dengan AI dari Prinsip Pertama: Metode 5 Langkah dengan Studi Kasus

Jangan minta AI memberikan jawaban. Gunakan sebagai sounding board untuk memvalidasi, meruntuhkan, dan membangun ulang asumsi Anda. Metode 5 langkah dengan dua studi kasus nyata.

Memasak dengan Panas yang Terbuang? Potensi dan Realitas Peralatan Memasak Heat Pump Pemulihan Panas Limbah

Memasak dengan Panas yang Terbuang? Potensi dan Realitas Peralatan Memasak Heat Pump Pemulihan Panas Limbah

Teknologi heat pump suhu tinggi pemulihan panas limbah yang secara revolusioner mengurangi pemborosan energi pada peralatan memasak konvensional — sejauh mana perkembangannya dan bagaimana kita dapat menyempurnakannya?

Membangun Bendungan dari Pasir Gurun, dan 30 Tahun Kemudian Menjadi Hutan

Membangun Bendungan dari Pasir Gurun, dan 30 Tahun Kemudian Menjadi Hutan

Proposal teknologi Oasis Pellet: mengikat pasir gurun yang tak berguna dengan perekat hayati untuk membuat tangki air yang, setelah masa pakainya habis, terurai menjadi tanah subur.

Baterai Anti-Kebakaran yang Mengubah Listrik Terbuang Menjadi Pupuk dan Pemanas

Baterai Anti-Kebakaran yang Mengubah Listrik Terbuang Menjadi Pupuk dan Pemanas

Listrik yang terbuang akibat curtailment tenaga surya disimpan dalam baterai Edison yang anti-kebakaran, lalu dari hidrogen diproduksi pupuk dan larutan urea secara mandiri — sebuah model integrasi energi-pertanian.