Технологии

Почему умные модели не могут объяснять

Почему умные модели не могут объяснять

Умные модели говорят сложно, а модели, которые объясняют просто, слабы в рассуждениях. Решение — разделить роли. Конкретный метод раздельного использования коммуникационной модели (основной) и модели рассуждений (subagent) в Claude Code, и почему эта структура работает.

abloq — блог, которым управляет агент, а проверку запирает машина

abloq — блог, которым управляет агент, а проверку запирает машина

Поручи блог агенту — и статья появится. Проблема в том, что ей нельзя верить: он фабрикует источники, поднимает lastmod у статьи, которую даже не правил, трогает файлы, которых не просили. Если человеку всё равно придётся всё вычитывать, поручать не было смысла. Ответ abloq — разделение труда: генерация вероятностна, проверка детерминирована. Человек пишет лишь одну спецификацию инсайта (insight.yaml), а написание·перевод·обновление·подкрепление доказательствами агент выполняет квестами, и качество гарантирует детерминированный gate, выведенный из единственного blog.yaml. Запертый PASS необратим — агент одноразов, но прогресс накапливается.

reins — оставь домен от Quest CLI, а ratchet вынеси во фреймворк

reins — оставь домен от Quest CLI, а ratchet вынеси во фреймворк

how-make-quest научила строить Quest CLI голыми руками. Но стоит взяться за второй CLI — и ты снова пишешь тот же ratchet, те же scan/next/submit, тот же свод. reins вытаскивает этот инвариант во фреймворк — ratchet, скелет команд, свод и export поставляет reins, а ты реализуешь лишь gate своего домена (4 метода gate.Definition). Gate — это каталог правил защиты от cheese, а toulmin defeat graph возвращает агенту прохождение: «почему проиграл и что поменять, чтобы выиграть».

Как создать Quest CLI — построить инструмент, в котором завершение определяет машина

Как создать Quest CLI — построить инструмент, в котором завершение определяет машина

ИИ говорит: «Готово». На деле — не закончено. Эта статья о том, как самому построить инструмент, решающий эту проблему — Quest CLI. От принципа (почему) до скелета команд cobra (как): одной этой статьи достаточно, чтобы агент создал Go Quest CLI. huma — разобранный пример.

filefunc × Hono — код, читаемый агентом за один раз: с 60 строк до 18

filefunc × Hono — код, читаемый агентом за один раз: с 60 строк до 18

Мы отрефакторили реальный фреймворк Hono (23k звёзд) по правилам filefunc. Все 4419 тестов прошли. А измерения показали: медиана строк, которые агент читает ради одной концепции, упала с 60 до 18 — минус 71%. Дело не в количестве файлов, а в длине чтения.

GEO: Как заставить ИИ цитировать ваш контент

GEO: Как заставить ИИ цитировать ваш контент

Если ваш контент не цитируется в ответах ИИ, его не существует. Согласно статье GEO, указание источников +30%, статистика +32%, цитаты +41% повышения видимости. Инфраструктура, карта сайта, Wayback Machine, ссылки на статьи, социальная активность — пять осей для обеспечения видимости в ИИ.

huma -- Храповик который не пропускает ни одного эндпоинта

huma -- Храповик который не пропускает ни одного эндпоинта

Когда вы просите ИИ-агента протестировать 42 эндпоинта он объявляет готово примерно на 15-м. huma превращает список эндпоинтов в храповичную сессию чтобы агент не мог пропустить ни одного. scan next write verify.

codistill -- выжимает SSOT из существующего кода

codistill -- выжимает SSOT из существующего кода

Чтобы использовать yongol нужно начинать с SSOT с нуля? Нет. codistill автоматически извлекает OpenAPI DDL и sqlc-запросы из существующего кода в 16 веб-фреймворках на 8 языках.

Hurl останавливает дрейф vibe coding

Hurl останавливает дрейф vibe coding

Vibe coding рушится из-за логического дрейфа за 3 месяца. Кейсы CMU, METR, DORA и Amazon доказывают это. Объявите контракты API в plain text с помощью Hurl и зафиксируйте храповиком — подавляйте дрейф структурно, не ограничивая свободу ИИ.

Ratchet-код, использующий IFEval в обратную сторону

Ratchet-код, использующий IFEval в обратную сторону

Смещение угодливости LLM — не баг, а актив. Если объединить способность следовать инструкциям, измеряемую IFEval, с детерминированной обратной связью, даже локальная модель 4.5B создаёт цикл сходимости, генерирующий корректный код.

yongol — Киль SaaS, написанного с помощью ИИ

yongol — Киль SaaS, написанного с помощью ИИ

Вайб-кодинг рушится на 200 эндпоинтах, потому что ИИ не может отличить решения от деталей реализации. yongol переносит цель работы ИИ с кода на 10 декларативных спецификаций и обеспечивает межслойную согласованность до компиляции. Harness with reins.

Ratchet Pattern — как заставить агента довести дело до конца

Ratchet Pattern — как заставить агента довести дело до конца

Я поручил AI-агенту написать тесты для 527 функций. Он остановился на 40-й и объявил: «Готово». Ratchet Pattern передаёт решение о завершении механическому verifier, заставляя агента дойти до конца.

tsma -- линия обороны от регрессий в legacy-коде

tsma -- линия обороны от регрессий в legacy-коде

CLI-инструмент, который индексирует все функции, определяет наличие тестов, измеряет coverage и даёт обратную связь LLM-агенту. Одна команда — и в legacy-коде появляется линия обороны от регрессий.

toulmin — движок правил, вычисляющий контракты

toulmin — движок правил, вычисляющий контракты

Движки правил 60 лет считали объект проверки фактом (fact). toulmin считает его утверждением (claim). Модель аргументации Тулмина реализована в виде движка правил на Go.

filefunc — один файл, одна концепция

filefunc — один файл, одна концепция

Единица навигации AI-агента по коду — это файл. Конвенция структурирования Go-кода и CLI-инструмент, который принудительно ограничивает один файл одной концепцией.

Feature Chain — Отслеживание всего стека по одному operationId

Feature Chain — Отслеживание всего стека по одному operationId

Какие файлы нужно изменить, чтобы модифицировать одну функциональность? Feature Chain принимает один operationId и автоматически извлекает всю область — API-спецификацию, схему БД, политику авторизации, диаграмму состояний, реализации функций, тестовые сценарии и фронтенд.

whyso — то, чего не показывает git blame

whyso — то, чего не показывает git blame

git blame показывает кто, когда и что изменил. whyso показывает почему. Инструмент для автоматического извлечения истории изменений по файлам из данных сессий Claude Code.

Решение проблемы климата — в космосе? Да, серьёзно.

Решение проблемы климата — в космосе? Да, серьёзно.

Установить солнцезащитный экран между Солнцем и Землёй, чтобы обратить изменение климата. Выходит с той же фабрики зеркал Дайсона — просто без покрытия. Летит сам, без двигателей. Убрал — всё вернулось. Расчёты сходятся.

SSaC — Service Sequences as Code

SSaC — Service Sequences as Code

Языконезависимая концепция, разбивающая бизнес-логику внутри сервисных функций на декларативные блоки (sequence). Достаточно объявить what с помощью 10 фиксированных типов — codegen заполнит how.

Мышление с ИИ от первых принципов: метод из 5 шагов с практическими кейсами

Мышление с ИИ от первых принципов: метод из 5 шагов с практическими кейсами

Не просите у ИИ ответов. Используйте его как резонатор для проверки, разрушения и пересборки своих предпосылок. Метод из 5 шагов с двумя реальными кейсами.

Готовить на выброшенном тепле? Возможности и реальность кухонных приборов с тепловыми насосами и рекуперацией тепла

Готовить на выброшенном тепле? Возможности и реальность кухонных приборов с тепловыми насосами и рекуперацией тепла

Технология высокотемпературных тепловых насосов с рекуперацией тепла, революционно снижающая энергопотери традиционных кухонных приборов — как далеко она продвинулась и как её можно улучшить?

Построить дамбу из пустынного песка, а через 30 лет она станет лесом

Построить дамбу из пустынного песка, а через 30 лет она станет лесом

Технология Oasis Pellet: бесполезный пустынный песок скрепляется биоклеем и превращается в резервуар для воды, а по истечении срока службы становится плодородной почвой.

Негорючая батарея, которая превращает выброшенное электричество в удобрения и тепло

Негорючая батарея, которая превращает выброшенное электричество в удобрения и тепло

Электричество, теряемое из-за ограничения выработки солнечных электростанций, сохраняется в пожаробезопасных батареях Эдисона, а из водорода на месте производятся удобрения и раствор мочевины — модель интеграции энергетики и сельского хозяйства.