
Image: AI generated
Лошадь без вожжей
ИИ-инструменты для кодирования стали быстрыми. Авторизация за 30 секунд. Оплата за 2 минуты. MVP выходит за три недели.
Через три месяца всё рушится.
ИИ «наводит порядок» в логике оплаты и меняет расчёт скидок. Запрос на рефакторинг меняет имена полей публичного API. Добавление новой функции ломает аутентификацию. Согласно исследованию Карнеги-Меллона (MSR 2026), сложность кода необратимо возрастает на 41% после внедрения ИИ-инструментов кодирования. Отчёт Google DORA Report (2025) показывает снижение стабильности доставки на 7,2% при каждом увеличении доли ИИ на 25%.
Проблема не в том, что ИИ глуп. Проблема в том, что нет вожжей.
Упряжь — это забор
Индустрия ответила «harness engineering». Линтеры, форматтеры, CI/CD, структура проекта, гайдлайны по коду. Заборы, не выпускающие агента за периметр.
Заборы не задают направление. Что бы агент ни делал внутри забора — перезаписывал существующую логику, менял типы, пропускал переходы состояний — линтер проходит. Форматтер проходит. CI проходит. Код попадает в продакшн «чистый, но неправильный».
Седло надето. Всадник в седле. Но без вожжей он держится бёдрами и через три месяца падает.
Reins Engineering
Reins Engineering — это инженерный подход, дающий ИИ-агентам детерминированные контракты и блокирующий продвижение при их нарушении.
Он состоит из трёх элементов:
1. Детерминированная обратная связь
Давайте агенту факты, а не мнения. Не «это выглядит странно», а «строка 41: несовпадение имени поля, ожидалось ‘user_id’, получено ‘userId’.» Обратная связь, не оставляющая места для sycophancy. Согласно исследованию TDAD (arxiv 2026), процедурные инструкции «применяй TDD» ухудшают регрессии (6,08% → 9,94%), тогда как предоставление конкретных тестовых файлов в контексте сокращает регрессии на 70% (6,08% → 1,82%).
2. Фиксация контрактов (Ratchet Pattern)
Когда верификация проходит — фиксируй. Hurl-тесты декларируют поведение API в виде обычного текста и запускаются на каждом коммите в CI. Прошедшие тесты нельзя удалить. Агент может свободно менять код, но не может менять поведение. Дрифт структурно подавлен.
3. Отделение решений от реализации
Три вещи, смешанные в коде — пользовательские решения, бизнес-логика, детали реализации — разделяются. Решения живут в декларативных спецификациях (OpenAPI, DDL, диаграммы состояний). Реализация свободно генерируется ИИ. ИИ не может спутать решения с деталями и перезаписать их. Выживаемость решений становится независимой от размера модели.
Эволюция
Prompt Engineering → Скажи правильно — и заработает
Context Engineering → Дай хороший контекст — и заработает
Harness Engineering → Удержи структурой
Reins Engineering → Направь вожжами
Каждый этап родился из ограничений предыдущего. Одних промптов не хватало для стабильности. Контекст не мешал агенту уходить в сторону. Заборы не предотвращали дрифт внутри периметра.
Reins Engineering — это не забор, это вожжи. Он не ограничивает свободу агента — он гарантирует, что агент доберётся до цели.
Почему большие модели — не ответ
«GPT-6 всё исправит.»
Не исправит. Проблема не в интеллекте модели, а в среде. Код как среда не различает решения и реализацию. Любая модель, читающая код, видит решения и детали смешанными в одном тексте.
Локальная модель в 4,5B параметров (Gemma4) с детерминированной обратной связью и примерами в контексте редактирует SSOT без ошибок. Frontier-модель, редактирующая сырой код, порождает дрифт. Разница — в структуре, не в интеллекте.
Не меняйте модель. Добавьте контракт.
Доказательства
yongol — это реализация Reins Engineering. Он перекрёстно валидирует согласованность 10 декларативных спецификаций (SSOT) по 287 правилам и генерирует код.
Бенчмарк ZenFlow — мультитенантный SaaS для автоматизации рабочих процессов. 32 эндпоинта, 14 таблиц, 47 Hurl-запросов. 11/11 этапов пройдено. Добавление функций не замедляло процесс. Существующие тесты ни разу не сломались.
Рабочий бэкенд был успешно сгенерирован локальной моделью в 4,5B параметров. Стоимость $0. Офлайн. Reins заполняет пробел, который оставляет размер модели.
Упряжь без вожжей — просто забор
ИИ уже достаточно мощный. Не хватает направления.
Стройте заборы выше — и агент будет быстрее дрифтовать внутри. Возьмите вожжи — и агент побежит к цели.
Reins Engineering — структурированная детерминированная верификация для ИИ-агентов.
Связанное
- yongol — Киль SaaS для ИИ-кодирования — Реализация Reins Engineering.
- Hurl останавливает дрифт вайб-кодирования — Hurl + Ratchet фиксирует поведение API.
- Ratchet Pattern — Теория детерминированной верификации и рэтчет-фиксации.
- IFEval-Exploiting Ratchet Code — Петли обратной связи с использованием sycophancy bias.
References
- Cursino, D. et al. (2026). “Speed at the Cost of Quality? The Impact of AI Coding on Software.” MSR 2026. arxiv.org/abs/2511.04427
- Google Cloud (2025). DORA Report 2025. cloud.google.com
- Wang, Z. et al. (2026). “TDAD: Test-Driven Agentic Development.” ACM AIWare 2026. arxiv.org/abs/2603.17973
- Karpathy, A. (2026). “From Vibe Coding to Agentic Engineering.” thenewstack.io