技术

聪明的模型为什么不会解释
聪明的模型说话晦涩难懂,善于解释的模型推理能力却不足。把它们分开用就行了。本文介绍在 Claude Code 中将沟通模型(主模型)与推理模型(子智能体)分离运用的具体方法,以及这种架构之所以有效的原因。

abloq —— 智能体运营的博客,验证由机器锁定
把博客交给智能体,文章是出得来的。问题在于它不可信——它会伪造出处,会给压根没改的文章抬高 lastmod,会动你没让它碰的文件。如果人要从头到尾全部审一遍,那委托还有什么意义。abloq 的答案是分工:生成是概率性的,验证是确定性的。人写的只有一张洞见规范(insight.yaml),撰稿、翻译、更新、补证由智能体以 Quest 代行,而质量由从一张 blog.yaml 派生出的确定性门来担保。锁定的 PASS 不可逆——智能体可以一次性用完,进展却会累积。

reins —— Quest CLI 只留下领域,ratchet 交给框架
how-make-quest 教你亲手打造 Quest CLI。可是当你造第二个 CLI 时,又得重写同样的 ratchet、同样的 scan/next/submit、同样的汇总。reins 把这些不变的部分抽成框架——ratchet、命令骨架、汇总、export 由 reins 供给,你只实现领域的门(gate.Definition 的 4 个方法)。门是 cheese 防御规则的目录,而 toulmin defeat 图会把『为什么输了、改什么就能赢』的攻略手册返还给智能体。

如何制作 Quest CLI —— 亲手打造让机器判定完成的工具
AI 会说"已经全部完成了"。可实际上并没有结束。本文教你亲手打造解决这个问题的工具——Quest CLI。从原理(为什么)到 cobra 命令骨架(怎么做),仅凭这一篇文章,就能让智能体造出一个 Go 编写的 Quest CLI。huma 就是实战示例。

filefunc × Hono — 让Agent一次读完的代码,从60行压缩到18行
我们用filefunc对star数23k的实战框架Hono进行了重构,4419个测试全部通过。测量结果显示——Agent读取单个概念时,代码中位数从60行缩减至18行,降幅71%。关键不在于文件数量,而在于「读取长度」。

GEO:让AI引用你的内容的方法
如果AI生成的回答不引用你的内容,你就等于不存在。根据GEO论文,来源引用提升+30%、统计数据+32%、引文+41%的可见性。基础设施、站点地图、Wayback Machine、论文引用、社交活动——五个维度确保AI可见性。

huma -- 一个端点都不漏的棘轮
让AI代理测试42个端点,它在第15个就宣布完成了。huma将端点列表变成棘轮会话,让代理一个都漏不了。scan、next、write、verify。四个命令,零配置。

codistill -- 从现有代码中蒸馏SSOT
用yongol必须从头写SSOT吗?不。codistill从8种语言、16个Web框架的现有代码中自动提取OpenAPI、DDL和sqlc查询。不是基础施工,而是抗震加固。

Hurl阻止Vibe Coding的漂移
Vibe coding在3个月内因逻辑漂移而崩溃。CMU、METR、DORA、Amazon的案例证明了这一点。用Hurl将API契约声明为纯文本并用棘轮锁定,在不限制AI自由的前提下结构性地抑制漂移。

反向利用IFEval的棘轮代码
LLM的谄媚偏差不是缺陷而是资产。将IFEval衡量的指令遵循能力与确定性反馈相结合,即使4.5B本地模型也能产生生成正确代码的收敛循环。

yongol — AI 编程 SaaS 的龙骨
氛围编程在200个端点处崩溃,因为AI无法区分决策与实现细节。yongol将AI的工作对象从代码转移到10种声明式规范,并在编译前强制执行跨层一致性。Harness with reins。

Ratchet Pattern — 让 Agent 做到底的方法
让 AI Agent 为 527 个函数编写测试,它在第 40 个时宣布'完成了'。Ratchet Pattern 通过将完成判定交给机械式 verifier,迫使 Agent 走到终点。

tsma -- 遗留代码的回归防线
一个 CLI 工具:索引所有函数、检测测试有无、测量覆盖率、向 LLM 代理提供精确反馈。一条命令为遗留代码构建回归防线。

toulmin -- 计算契约的规则引擎
规则引擎60年来一直将验证对象视为事实(fact)。toulmin将其视为主张(claim)。用Go规则引擎实现了Toulmin的论证模型。

filefunc — 一文件一概念
AI 代码智能体的导航单位是文件。filefunc 是一种 Go 代码结构约定和 CLI 工具,强制每个文件只包含一个概念。

Feature Chain — 用一个 operationId 追踪整个全栈
要修改一个功能需要改动哪些文件?Feature Chain 只需输入一个 operationId,就能自动提取完整范围——API 规范、DB Schema、授权策略、状态图、函数实现、测试场景以及前端。

whyso — git blame 看不到的那部分
git blame 能告诉你谁、何时、改了什么。whyso 告诉你为什么改。从 Claude Code 会话数据中自动提取每个文件的变更历史。

气候变化的解决方案在太空?没错,是真的。
在太阳和地球之间安装遮阳膜来逆转气候变化。戴森镜工厂去掉镀层就能生产遮阳膜,无需推进剂自行飞行,撤掉即可恢复原状。数学上完全成立。

SSaC — Service Sequences as Code
一种语言无关的概念,将服务函数内部的业务流程分解为声明式块(sequence)。只需用10种固定类型声明what,codegen自动填充how。

AI思考法:用第一性原理拆解前提的5个步骤
别向AI要答案。把AI当作共鸣板,快速验证、拆解、重组你的前提假设。5步方法论,两个实战案例。

用废弃的热量做饭?废热回收型热泵烹饪设备的可能性与现实
革命性地减少传统烹饪设备能源浪费的废热回收型高温热泵技术,究竟发展到了什么程度?又该如何改进?

用沙漠的沙子筑坝,30年后这座坝变成森林
提出一种绿洲颗粒技术:用生物粘合剂将毫无用处的沙漠沙子压制成蓄水池,使用寿命结束后自然分解为肥沃土壤。

用不会起火的电池,把浪费的电变成肥料和暖气
用不会起火的爱迪生电池储存因太阳能出力限制而浪费的电力,再从氢气生产肥料和尿素液,实现能源与农业融合的自给自足模式。