abloq —— 智能体运营的博客,验证由机器锁定 Image: AI generated

how-make-quest 讲的是如何亲手打造 Quest CLI,reins 把那份不变抽成了框架。这一篇是这条谱系的下一格——把同一个命题钉进一个领域的工具,abloq(Agentic blog Quest)。

文章是出得来的,只是不可信

把博客交给智能体试过的人都知道。**文章是出得来的。**只要丢个主题,它就会收集资料、堆砌段落,端出一篇像模像样的稿子。真正的问题在别处——它不可信。

智能体会伪造出处。它把不存在的 URL 钉进脚注,把与标题无关的页面挂作引用。它会悄悄给压根没改的文章抬高 lastmod,让它看起来很新鲜。你让它修一篇,它连旁边那篇的 front matter 和布局都动了。于是最终还是得人把全部重读一遍。可是**如果人要把每一篇都逐行审一遍,那一开始委托就毫无意义。**自动化反倒新造出了一份审稿劳动。

这不会因为把模型养得更大就消失。只要让它自己评判自己的文章,能力上去了也只是更擅长找到评判的缝隙罢了。

人写的只有一张 —— insight.yaml

abloq 的答案是分工:**生成可以是概率性的,验证必须是确定性的。**撰写散文这件非确定的劳动由智能体来做,而它产物的合格与否由机器来定。

所以人写的只有一张洞见规范insight.yaml。把主题、观点、要谈的主张(claims)写成机器可对照的形态。

# insight.yaml —— 人写的全部
topic: "robots.txt —— 30 年惯例如何成为标准"
stance: "robots.txt 不是访问控制装置,而是信号"
claims:
  - id: rep-standardized-2022
    text: "robots.txt 惯例始于 1994 年,但成为 IETF 标准(RFC 9309)是在 2022 年"
    requires_source: true
    anchors: ["RFC 9309", "1994"]

这里写下的 claims 就成了撰稿门的判据。**规范里没有的主张不能成为文章的正论,规范里有的主张必须在正文中得到对应。**资料收集、撰稿、润色、翻译、发布、更新,从那之后全是智能体的份。

blog.yaml —— 一个博客的全部声明

如果说规范是一篇文章的 SSOT,那么 blog.yaml 就是一个博客的 SSOT。它把站点、语言、章节、文章的正规结构、GEO 阈值、部署都装进一个文件。

site: { baseURL: https://example.com, title: My Blog }
languages: [en, ko, ja]          # 首项 = 默认语言
sections: [tech, opinion]
structure:
  order: [image, attribution, body, related, sources, changelog]
geo: { min_sources: 1, freshness_days: 90 }

hugo.tomlrobots.txtllms.txtsitemap(hreflang)、JSON-LD、门规则参数全都从这里派生。只要 blog.yaml 不变,任何文章都无法绕过门——**约束即契约。**把声明手抄一遍的那些配置文件互相错位的漂移,从结构上就变得不可能。

FAIL 不是意见,而是事实

智能体提交(submit)文章,门就给出判定。下面是真实的运行记录——智能体漏掉了出处章节,还把一个无法访问的 URL 挂作引用:

en/tech/robots-exclusion-protocol -> FAIL
  - min-sources: content/en/tech/robots-exclusion-protocol.md:1
    actual="sources section missing — geo.min_sources requires >= 1"
  - citation-exists: content/en/tech/robots-exclusion-protocol.md:19
    actual="https://www.robotstxt.org/orig.html is not reachable (HTTP 403)"

FAIL 不是"好像有点怪"那样的意见。**它是钉着位置(文件:行)和期望值的事实(Fact)。**要改的不是猜测,而是那一条 Fact。智能体凭这份反馈收敛,而修订后的提交只有通过全部规则,机器才会锁定 PASS

这里,how-make-quest 的悖论再度运作。模型会谄媚——它会顺从地遵循指令。对意见而言谄媚是毒,但**对事实而言谄媚是资产。**把 Fact 回喂回去,越是谄媚的模型,越会顺从地接受那个 Fact 并收敛。

锁定的东西无法回退 —— ratchet

门的核心不是判定,而是不可逆性。一旦锁定的 PASS 不会向后滑落。下一个会话的智能体哪怕把同一篇文章搞砸,也无法跌破基线。

所以**智能体可以一次性用完,进展却会累积。**上下文飞了、模型换了、会话断了,锁定的格子依然锁定着。这就是 ratchet——只锁住通过的那部分,而锁住的东西不容回归。把完成判定的权限交给确定性机器、而非概率性 LLM,也正是为了这个。自我验证几乎提升不了性能早已是测得的事实,而既然 LLM-as-Judge 从结构上不可能,判定者就必须是代码。

五个 Quest,各自以门闭合

abloq 只把触碰散文的非确定劳动留作 Quest。检出、生成、测量、外部 API 调用由确定性代码完成,智能体只做撰写文章这五件事。每个 Quest 都以门闭合。

Quest触发门(核心)
writing人的 insight.yaml规范每一项在正文中对应 · 引用实在性验证 · 出处 ≥ 阈值
translation新文章 + 正文实变更结构无损(translation-parity)+ 全语言 slug 一致 + 构建 0 错误
refresh新鲜度扫描器队列须伴随正文实变更 · 拦截空 lastmod 更新(honest-lastmod)
evidence主张-出处扫描器队列出处 ≥ 阈值 · 新增引用实在 · 队列外主张一个字都不变
cluster集群扫描器队列标签存在于 taxonomy · 孤儿标签 0 · 内部链接 ≥ 阈值

cheese 防御为全部 Quest 所共有。保留 front matter,门判定与存储库落地的字节一致,禁止改动队列条目范围之外的文件。智能体不会直接去打外部 API——存档、索引这类副作用由后端的收据来处理。

测量指定下一份劳动 —— GEO 是运营

AI 是否引用了你的文章,无法被直接观测。abloq 以三层代理来测量——爬取层(CloudFront 日志里的 AI 机器人命中,确定性)、索引层(GSC 曝光、点击趋势,确定性)、引用层(周期性运行一组标准查询,把 AI 回答中的引用作为趋势记录,因为非确定所以不门化)。

关键在于测量并不止步于此。测量结果会成为优先级队列的权重,指定下一个 Quest 的输入。陈旧的文章落进 refresh 队列,无出处的主张落进 evidence 队列,孤立的文章落进 cluster 队列。测量指定劳动的 ratchet——所以**GEO 不是状态,而是运营。**它不是优化一次就完事的分数,而是一直转动的循环。提升引用的要素(出处、统计、引用文)能切实提高可见性,这是生成引擎优化研究定量展示过的。

立于 reins 之上 —— 谱系

abloq 的门不是从光地起步的。它立于确定性门引擎 reins 之上。reins 供给 ratchet、命令骨架(scan/next/submit)、汇总与 export,而 abloq 只实现博客领域的门(结构、根据、政策规则集)。

谱系是分明的。how-make-quest 教的是亲手打造 Quest 的原理reins 把那个原理抽成了框架abloq 把那个框架钉进了博客这一个领域。同一句话在三个不同的高度落地——生成是概率性的,验证是确定性的。

这一篇也是 abloq 锁定的

这篇文章是用 abloq 的 writing Quest 写的。以上面展示的 insight.yaml 作种子播种(scan),领取撰稿提示词(next)写正文,提交(submit)让它通过门。出处章节是否越过阈值、引用 URL 是否真能访问、规范的所有 claim 是否在正文中对应——这些判定不是由人眼,而是由机器做的。

撰稿智能体无法 REVIEW 自己的文章。REVIEW 必须由另一个上下文的审阅者撰写,而 review-record 规则确定性地检查那道隔离。从结构上排除谄媚的判定者——让这篇文章无法自我吹捧的那道装置,正是这篇文章所阐释的那条原理。

当约束可验证、违规有定义、且能够强制时,系统就会收敛。博客也不例外。

相关文章

延伸阅读(外部)

参考文献

  • Aggarwal, P. et al. (2024). “GEO: Generative Engine Optimization.” KDD 2024. arXiv:2311.09735 —— 添加出处、统计、引用文能定量提高生成引擎内可见性的测量。abloq 可见性运营的根据。
  • Stechly, K., Valmeekam, K., & Kambhampati, S. (2024). “On the Self-Verification Limitations of Large Language Models.” arXiv:2402.08115 —— 自我验证几乎提升不了性能 → 完成判定权限必须交给确定性机器的理由。
  • Koster, M., Illyes, G., Zeller, H., & Sassman, L. (2022). “Robots Exclusion Protocol.” RFC 9309 —— 30 年惯例成为 IETF 标准的案例(robots.txt 示例的出处)。

变更历史

  • 2026-06-11:初版