Reins Engineering

Что такое «turn» в reins?

Анатомия turn — минимальной единицы исполнения в reins. Что не записано, то не turn — из одного этого определения следуют независимость от драйвера, устойчивость к перезапуску и аудируемость. Сравнивая с дискурсом Loop Engineering июня 2026-го, мы видим, как turn превращает те рекомендации в структуру.

2026-07-07

Система делает гения ещё ярче

Гений без структуры дрейфует, а одна лишь структура даёт посредственность. Настоящая отдача появляется, когда гений и структура перемножаются. Бенчмарк ZenFlow, где Claude Sonnet за 43 минуты прошёл 32 эндпоинта, и тот же принцип, доказанный B-17, Toyota и чек-листом WHO.

2026-06-25

abloq — блог, которым управляет агент, а проверку запирает машина

Поручи блог агенту — и статья появится. Проблема в том, что ей нельзя верить: он фабрикует источники, поднимает lastmod у статьи, которую даже не правил, трогает файлы, которых не просили. Если человеку всё равно придётся всё вычитывать, поручать не было смысла. Ответ abloq — разделение труда: генерация вероятностна, проверка детерминирована. Человек пишет лишь одну спецификацию инсайта (insight.yaml), а написание·перевод·обновление·подкрепление доказательствами агент выполняет квестами, и качество гарантирует детерминированный gate, выведенный из единственного blog.yaml. Запертый PASS необратим — агент одноразов, но прогресс накапливается.

2026-06-11

Почему ваш агентный цикл расходится

Чем шире распространяется Loop Engineering, тем чаще люди упираются в одну и ту же стену — цикл не сходится, а расходится. У бесконечного кружения, дрейфа и взлома награды три лица, но корень один: в слот суждения цикла снова вставлен сам генератор. Но расхождение — это, по сути, везение. Его видно. По-настоящему страшен цикл, который тихо сошёлся к лжи. Рецепт один — право запирать «готово» отдать не LLM, а только детерминированному gate.

2026-06-11

Продакшн-трафик и есть спецификация

У легаси-кода нет документации. Нет тестов. И тем не менее он сейчас работает. Хорошо записанный лог за месяц и есть спецификация — если построить Hurl-интеграционные тесты, захватывающие текущее поведение из продакшн-трафика, вы зафиксируете функциональность легаси и подстелите страховку под рефакторинг, не прочитав ни строчки кода.

2026-06-06

Сжечь целый город ради одного ответа

Модель на триллион параметров сжигает столько электричества и воды, сколько целый город, чтобы выдать один-единственный ответ. Я считал это безумием. Блуждая в поисках ответа, я понял: тот самый изъян, который все пытались исправить, склонность LLM к лести, и был ответом. Накорми её fact, и лесть превращается в точность. Это рассказ о том, почему я начал Reins.

2026-06-06

reins — оставь домен от Quest CLI, а ratchet вынеси во фреймворк

how-make-quest научила строить Quest CLI голыми руками. Но стоит взяться за второй CLI — и ты снова пишешь тот же ratchet, те же scan/next/submit, тот же свод. reins вытаскивает этот инвариант во фреймворк — ratchet, скелет команд, свод и export поставляет reins, а ты реализуешь лишь gate своего домена (4 метода gate.Definition). Gate — это каталог правил защиты от cheese, а toulmin defeat graph возвращает агенту прохождение: «почему проиграл и что поменять, чтобы выиграть».

2026-06-05

Инструмент, давший нам поводья, сам оказался без поводьев — граница между сбруей и Reins

"Reins Engineering — это ведь просто harness engineering?" Они не противостоят друг другу — это разные части одной упряжи. Но именно разные части. Даже лучший в мире агент для написания кода не надел поводья на собственный код — потому что поводья не имеют, а накладывают.

2026-06-04

Как создать Quest CLI — построить инструмент, в котором завершение определяет машина

ИИ говорит: «Готово». На деле — не закончено. Эта статья о том, как самому построить инструмент, решающий эту проблему — Quest CLI. От принципа (почему) до скелета команд cobra (как): одной этой статьи достаточно, чтобы агент создал Go Quest CLI. huma — разобранный пример.

2026-06-03

Предпосылки повышения точности мультиагентных LLM-систем

Запустишь несколько агентов — и станет точнее? Верно лишь наполовину. Модели, обученные на одних и тех же данных, ошибаются в одних и тех же местах. Мультиагентность работает при двух условиях — либо вы проектируете независимость ошибок, либо в верифицируемой области ставите verifier за пределами LLM.

2026-06-02

Почему ваш агент никогда не останавливается

Когда хвастаются, что гоняют агента сутки напролёт, возникает не восхищение, а вопрос — почему он до сих пор не закончил? Код — это не задача поиска, а задача удовлетворения ограничений. Здоровая система — это та, что умеет останавливаться.

2026-06-01

О красоте

70% красивого — это математика. Порядок машина детерминированно фиксирует, и лишь 30% сложности решает человек. Reins Engineering — это не инструмент для ИИ-кодинга, а принцип: зафиксировать порядок и оставить человеку только сложность.

2026-05-31

Кто определяет «завершение» — проблема, которую игры решили 40 лет назад

Когда «выселение подтверждено» определяется пятью фотографиями — это уже квест. Определить «завершение» не как утверждение исполнителя, а как механически верифицируемое условие — проблема, которую игры решили 40 лет назад, и именно так нужно правильно ставить задачи AI-агентам.

2026-05-30

Урок 11. Как спасти провалившийся vibe coding проект

Приложение, созданное с помощью vibe coding, сломалось. Переписывать с нуля не нужно. Диагностируйте, зафиксируйте и выходите шаг за шагом.

2026-05-28

Supabase — ловушка вайб-кодинга

ИИ рекомендует Supabase не из-за технического превосходства, а потому что в обучающих данных слишком много туториалов. Когда бизнес-логика попадает в чёрный ящик, агент теряет её след. Войти — 30 секунд. Выйти — 3 месяца.

2026-05-28

Построение систем, пригодных для агентов

60–80% IT-бюджетов Fortune 500 уходит на охрану запертого legacy. Потому что его нельзя открыть. Настоящий смысл пузыря ИИ — не в том, что модели умнеют, а в том, что запертая корпоративная память начинает становиться достижимой.

2026-05-27

huma -- Храповик который не пропускает ни одного эндпоинта

Когда вы просите ИИ-агента протестировать 42 эндпоинта он объявляет готово примерно на 15-м. huma превращает список эндпоинтов в храповичную сессию чтобы агент не мог пропустить ни одного. scan next write verify.

2026-05-26

codistill -- выжимает SSOT из существующего кода

Чтобы использовать yongol нужно начинать с SSOT с нуля? Нет. codistill автоматически извлекает OpenAPI DDL и sqlc-запросы из существующего кода в 16 веб-фреймворках на 8 языках.

2026-05-26

Agent Operable Codebase

Код, удобный для чтения людьми, и код, удобный для работы агентов — одно и то же? Нет. Когда в файле 20 функций, производительность агента падает на 30-85%. Офис надо превратить в фабрику.

2026-05-25

Урок 10. Закон данных — Agent Operable Data

Если код неправильный, тесты поймают. Если данные неправильные, никто не узнает. Схема — это закон, который я устанавливаю.

2026-05-24

Урок 9. Автоматизация за пределами кода — Agent Operable System

Достаточно ли, чтобы только код был agent-operable? Структура, в которой агенты управляют сборкой, развёртыванием и мониторингом.

2026-05-24

Урок 8. Фабрика агента — Agent Operable Codebase

20 функций в одном файле, производительность агента падает на 30-85%. Разделяйте с filefunc, тестируйте с tsma.

2026-05-24

Урок 7. Переворачивая лесть — Баланс промптов и верификаторов

Дайте мнение — и он льстит. Дайте факт — и он исправляет.

2026-05-24

Урок 6. Прошёл — заблокировал — Принципы и массовое применение Ratchet Pattern

ИИ заявил что закончил. На самом деле 40/527. Ratchet Pattern передаёт решение о завершении машине.

2026-05-24

Урок 5. ИИ с поводьями — Введение в Reins Engineering

Инженерия обвязки — это забор. Reins Engineering — это поводья. Не меняйте модель, добавляйте контракты.

2026-05-24

Урок 4. Решения за пределами кода — yongol и декларативное управление full-stack

ИИ не может отличить решения от деталей реализации. yongol разделяет решения на 10 декларативных спецификаций.

2026-05-24

Урок 3. Приложения, которые не ломаются — Hurl, Git, CI/CD

Объявляйте контракты API с Hurl, создавайте точки сохранения с Git, автоматизируйте проверку с CI/CD.

2026-05-24

Урок 2. Как не доверять ИИ — Пределы и причины вайб-кодинга

Дрифт, при котором ИИ тихо изменяет существующие функции при добавлении новых, предвзятость лести 58%.

2026-05-24

Урок 1. Как командовать ИИ — Основы вайб-кодинга

От установки Claude Code до управления контекстом с CLAUDE.md. Как человек, не знающий кода, может командовать ИИ.

2026-05-24

Урок 0. Установка Claude Code — Возможно, вы используете не Claude Code

Половина того, что YouTube называет «Claude Code», — это не Claude Code. Одна и та же модель, но разные агенты дают разные результаты. Вход на курс начинается здесь.

2026-05-24

Reins Engineering — ИИ под управлением

Harness engineering — это забор. Он не выпускает агента за периметр, но не гарантирует, что тот дойдёт до цели. Reins Engineering — это вожжи: направляй детерминированными контрактами, фиксируй рэтчетом, отделяй решения от реализации.

2026-05-23

Hurl останавливает дрейф vibe coding

Vibe coding рушится из-за логического дрейфа за 3 месяца. Кейсы CMU, METR, DORA и Amazon доказывают это. Объявите контракты API в plain text с помощью Hurl и зафиксируйте храповиком — подавляйте дрейф структурно, не ограничивая свободу ИИ.

2026-05-22

Ratchet-код, использующий IFEval в обратную сторону

Смещение угодливости LLM — не баг, а актив. Если объединить способность следовать инструкциям, измеряемую IFEval, с детерминированной обратной связью, даже локальная модель 4.5B создаёт цикл сходимости, генерирующий корректный код.

2026-05-20

yongol — Киль SaaS, написанного с помощью ИИ

Вайб-кодинг рушится на 200 эндпоинтах, потому что ИИ не может отличить решения от деталей реализации. yongol переносит цель работы ИИ с кода на 10 декларативных спецификаций и обеспечивает межслойную согласованность до компиляции. Harness with reins.

2026-05-18

Sycophancy ИИ — это бизнес-фича

Подхалимство LLM — не баг. Это математическая неизбежность RLHF и коммерческая фича, которую у крупных технологических компаний нет стимула исправлять. Вот почему LLM-as-Judge структурно невозможен.

2026-05-18

Почему кодинг-агенты работают и почему ломаются

Одна и та же модель галлюцинирует в веб-чате, но выдаёт фичу на 200 строк в кодинг-агенте. Не потому что модель изменилась — потому что изменилась топология. Генерация может быть вероятностной. Верификация должна быть детерминированной.

2026-05-16

Ratchet Pattern — как заставить агента довести дело до конца

Я поручил AI-агенту написать тесты для 527 функций. Он остановился на 40-й и объявил: «Готово». Ratchet Pattern передаёт решение о завершении механическому verifier, заставляя агента дойти до конца.

2026-05-15

Топология обратной связи важнее IQ модели

Одна и та же модель останавливается на 40 или завершает все 527. Разница не в модели — а в структуре обратной связи. Производительность LLM гораздо больше зависит от того, насколько быстрый и детерминированный цикл обратной связи, чем от самой модели.

2026-05-14

tsma -- линия обороны от регрессий в legacy-коде

CLI-инструмент, который индексирует все функции, определяет наличие тестов, измеряет coverage и даёт обратную связь LLM-агенту. Одна команда — и в legacy-коде появляется линия обороны от регрессий.

2026-05-14

filefunc — один файл, одна концепция

Единица навигации AI-агента по коду — это файл. Конвенция структурирования Go-кода и CLI-инструмент, который принудительно ограничивает один файл одной концепцией.

2026-03-16