Reins Engineering

Hurl останавливает logic drift в vibe coding

Hurl останавливает logic drift в vibe coding

Vibe coding разваливается в logic drift за три месяца. CMU, METR, DORA и Amazon это доказали. Объявите API-контракты в plain text с помощью Hurl и зафиксируйте их рэтчетом — drift структурно подавляется, не ограничивая свободу ИИ.

Ratchet-код, использующий IFEval в обратную сторону

Ratchet-код, использующий IFEval в обратную сторону

Sycophancy-смещение LLM — не баг, а актив. Если способность следовать инструкциям, которую измеряет IFEval, соединить с детерминированной обратной связью, даже локальная модель на 4.5B параметров создаёт сходящийся цикл генерации точного кода.

yongol — Киль SaaS, написанного с помощью ИИ

yongol — Киль SaaS, написанного с помощью ИИ

Вайб-кодинг разваливается на 200 эндпоинтах, потому что ИИ не может отличить решения от деталей реализации. yongol переносит работу ИИ с кода на 10 декларативных спецификаций и обеспечивает межслойную согласованность до компиляции. Harness with reins.

Sycophancy ИИ — это бизнес-фича

Sycophancy ИИ — это бизнес-фича

Sycophancy LLM — не баг. Это математическая неизбежность RLHF и коммерческая функция, которую у Big Tech нет стимула исправлять. Именно поэтому LLM-as-Judge структурно невозможен.

Почему кодинг-агенты работают и почему ломаются

Почему кодинг-агенты работают и почему ломаются

Одна и та же модель галлюцинирует в веб-чате и работает в кодинг-агенте. Дело не в модели — дело в topology. Генерация может быть вероятностной. Верификация должна быть детерминированной.

Ratchet Pattern -- как заставить агента довести дело до конца

Ratchet Pattern -- как заставить агента довести дело до конца

Я поручил AI-агенту написать тесты для 527 функций. Он остановился на 40-й и объявил: «Готово». Ratchet Pattern передаёт решение о завершении механическому verifier, заставляя агента дойти до конца.

Топология обратной связи важнее IQ модели

Топология обратной связи важнее IQ модели

Одна и та же модель может остановиться на 40 или завершить 527. Разница — не в модели, а в структуре обратной связи. Производительность LLM определяется не столько самой моделью, сколько тем, насколько быстрый и детерминированный цикл обратной связи её окружает.

tsma — линия обороны от регрессий в legacy-коде

tsma — линия обороны от регрессий в legacy-коде

CLI-инструмент, который индексирует все функции, определяет наличие тестов, измеряет coverage и даёт обратную связь LLM-агенту. Одна команда — и в legacy-коде появляется линия обороны от регрессий.

filefunc — один файл, одна концепция

filefunc — один файл, одна концепция

Единица навигации AI-агента по коду — это файл. Конвенция структурирования Go-кода и CLI-инструмент, который принудительно ограничивает один файл одной концепцией.