LLM

Предпосылки повышения точности мультиагентных LLM-систем

Предпосылки повышения точности мультиагентных LLM-систем

Запустишь несколько агентов — и станет точнее? Верно лишь наполовину. Модели, обученные на одних и тех же данных, ошибаются в одних и тех же местах. Мультиагентность работает при двух условиях — либо вы проектируете независимость ошибок, либо в верифицируемой области ставите verifier за пределами LLM.

Ratchet-код, использующий IFEval в обратную сторону

Ratchet-код, использующий IFEval в обратную сторону

Смещение угодливости LLM — не баг, а актив. Если объединить способность следовать инструкциям, измеряемую IFEval, с детерминированной обратной связью, даже локальная модель 4.5B создаёт цикл сходимости, генерирующий корректный код.

Sycophancy ИИ — это бизнес-фича

Sycophancy ИИ — это бизнес-фича

Подхалимство LLM — не баг. Это математическая неизбежность RLHF и коммерческая фича, которую у крупных технологических компаний нет стимула исправлять. Вот почему LLM-as-Judge структурно невозможен.

Почему кодинг-агенты работают и почему ломаются

Почему кодинг-агенты работают и почему ломаются

Одна и та же модель галлюцинирует в веб-чате, но выдаёт фичу на 200 строк в кодинг-агенте. Не потому что модель изменилась — потому что изменилась топология. Генерация может быть вероятностной. Верификация должна быть детерминированной.

Топология обратной связи важнее IQ модели

Топология обратной связи важнее IQ модели

Одна и та же модель останавливается на 40 или завершает все 527. Разница не в модели — а в структуре обратной связи. Производительность LLM гораздо больше зависит от того, насколько быстрый и детерминированный цикл обратной связи, чем от самой модели.

tsma -- линия обороны от регрессий в legacy-коде

tsma -- линия обороны от регрессий в legacy-коде

CLI-инструмент, который индексирует все функции, определяет наличие тестов, измеряет coverage и даёт обратную связь LLM-агенту. Одна команда — и в legacy-коде появляется линия обороны от регрессий.

Ограничения — это контракты

Ограничения — это контракты

Без обещания — хаос, обещание сверх меры — угнетение. Разумное ограничение образует золотое сечение. Принцип верховенства закона одинаково применим к коду и к знанию.

filefunc — один файл, одна концепция

filefunc — один файл, одна концепция

Единица навигации AI-агента по коду — это файл. Конвенция структурирования Go-кода и CLI-инструмент, который принудительно ограничивает один файл одной концепцией.