abloq —— 智能体运营的博客，验证由机器锁定

abloq —— 智能体运营的博客，验证由机器锁定 Image: AI generated

how-make-quest 讲的是如何亲手打造 Quest CLI，reins 把那份不变抽成了框架。这一篇是这条谱系的下一格——把同一个命题钉进一个领域的工具，abloq（Agentic blog Quest）。

文章是出得来的，只是不可信

把博客交给智能体试过的人都知道。**文章是出得来的。**只要丢个主题，它就会收集资料、堆砌段落，端出一篇像模像样的稿子。真正的问题在别处——它不可信。

智能体会伪造出处。它把不存在的 URL 钉进脚注，把与标题无关的页面挂作引用。它会悄悄给压根没改的文章抬高 lastmod，让它看起来很新鲜。你让它修一篇，它连旁边那篇的 front matter 和布局都动了。于是最终还是得人把全部重读一遍。可是**如果人要把每一篇都逐行审一遍，那一开始委托就毫无意义。**自动化反倒新造出了一份审稿劳动。

这不会因为把模型养得更大就消失。只要让它自己评判自己的文章，能力上去了也只是更擅长找到评判的缝隙罢了。

人写的只有一张 —— insight.yaml

abloq 的答案是分工：**生成可以是概率性的，验证必须是确定性的。**撰写散文这件非确定的劳动由智能体来做，而它产物的合格与否由机器来定。

所以人写的只有一张洞见规范，insight.yaml。把主题、观点、要谈的主张（claims）写成机器可对照的形态。

# insight.yaml —— 人写的全部
topic: "robots.txt —— 30 年惯例如何成为标准"
stance: "robots.txt 不是访问控制装置，而是信号"
claims:
  - id: rep-standardized-2022
    text: "robots.txt 惯例始于 1994 年，但成为 IETF 标准（RFC 9309）是在 2022 年"
    requires_source: true
    anchors: ["RFC 9309", "1994"]

这里写下的 claims 就成了撰稿门的判据。**规范里没有的主张不能成为文章的正论，规范里有的主张必须在正文中得到对应。**资料收集、撰稿、润色、翻译、发布、更新，从那之后全是智能体的份。

blog.yaml —— 一个博客的全部声明

如果说规范是一篇文章的 SSOT，那么 blog.yaml 就是一个博客的 SSOT。它把站点、语言、章节、文章的正规结构、GEO 阈值、部署都装进一个文件。

site: { baseURL: https://example.com, title: My Blog }
languages: [en, ko, ja]          # 首项 = 默认语言
sections: [tech, opinion]
structure:
  order: [image, attribution, body, related, sources, changelog]
geo: { min_sources: 1, freshness_days: 90 }

hugo.toml、robots.txt、llms.txt、sitemap（hreflang）、JSON-LD、门规则参数全都从这里派生。只要 blog.yaml 不变，任何文章都无法绕过门——**约束即契约。**把声明手抄一遍的那些配置文件互相错位的漂移，从结构上就变得不可能。

FAIL 不是意见，而是事实

智能体提交（submit）文章，门就给出判定。下面是真实的运行记录——智能体漏掉了出处章节，还把一个无法访问的 URL 挂作引用：

en/tech/robots-exclusion-protocol -> FAIL
  - min-sources: content/en/tech/robots-exclusion-protocol.md:1
    actual="sources section missing — geo.min_sources requires >= 1"
  - citation-exists: content/en/tech/robots-exclusion-protocol.md:19
    actual="https://www.robotstxt.org/orig.html is not reachable (HTTP 403)"

FAIL 不是"好像有点怪"那样的意见。**它是钉着位置（文件:行）和期望值的事实（Fact）。**要改的不是猜测，而是那一条 Fact。智能体凭这份反馈收敛，而修订后的提交只有通过全部规则，机器才会锁定 PASS。

这里，how-make-quest 的悖论再度运作。模型会谄媚——它会顺从地遵循指令。对意见而言谄媚是毒，但**对事实而言谄媚是资产。**把 Fact 回喂回去，越是谄媚的模型，越会顺从地接受那个 Fact 并收敛。

锁定的东西无法回退 —— ratchet

门的核心不是判定，而是不可逆性。一旦锁定的 PASS 不会向后滑落。下一个会话的智能体哪怕把同一篇文章搞砸，也无法跌破基线。

所以**智能体可以一次性用完，进展却会累积。**上下文飞了、模型换了、会话断了，锁定的格子依然锁定着。这就是 ratchet——只锁住通过的那部分，而锁住的东西不容回归。把完成判定的权限交给确定性机器、而非概率性 LLM，也正是为了这个。自我验证几乎提升不了性能早已是测得的事实，而既然 LLM-as-Judge 从结构上不可能，判定者就必须是代码。

五个 Quest，各自以门闭合

abloq 只把触碰散文的非确定劳动留作 Quest。检出、生成、测量、外部 API 调用由确定性代码完成，智能体只做撰写文章这五件事。每个 Quest 都以门闭合。

Quest	触发	门（核心）
writing	人的 insight.yaml	规范每一项在正文中对应 · 引用实在性验证 · 出处 ≥ 阈值
translation	新文章 + 正文实变更	结构无损（translation-parity）+ 全语言 slug 一致 + 构建 0 错误
refresh	新鲜度扫描器队列	须伴随正文实变更 · 拦截空 lastmod 更新（honest-lastmod）
evidence	主张-出处扫描器队列	出处 ≥ 阈值 · 新增引用实在 · 队列外主张一个字都不变
cluster	集群扫描器队列	标签存在于 taxonomy · 孤儿标签 0 · 内部链接 ≥ 阈值

cheese 防御为全部 Quest 所共有。保留 front matter，门判定与存储库落地的字节一致，禁止改动队列条目范围之外的文件。智能体不会直接去打外部 API——存档、索引这类副作用由后端的收据来处理。

测量指定下一份劳动 —— GEO 是运营

AI 是否引用了你的文章，无法被直接观测。abloq 以三层代理来测量——爬取层（CloudFront 日志里的 AI 机器人命中，确定性）、索引层（GSC 曝光、点击趋势，确定性）、引用层（周期性运行一组标准查询，把 AI 回答中的引用作为趋势记录，因为非确定所以不门化）。

关键在于测量并不止步于此。测量结果会成为优先级队列的权重，指定下一个 Quest 的输入。陈旧的文章落进 refresh 队列，无出处的主张落进 evidence 队列，孤立的文章落进 cluster 队列。测量指定劳动的 ratchet——所以**GEO 不是状态，而是运营。**它不是优化一次就完事的分数，而是一直转动的循环。提升引用的要素（出处、统计、引用文）能切实提高可见性，这是生成引擎优化研究定量展示过的。

立于 reins 之上 —— 谱系

abloq 的门不是从光地起步的。它立于确定性门引擎 reins 之上。reins 供给 ratchet、命令骨架（scan/next/submit）、汇总与 export，而 abloq 只实现博客领域的门（结构、根据、政策规则集）。

谱系是分明的。how-make-quest 教的是亲手打造 Quest 的原理，reins 把那个原理抽成了框架，abloq 把那个框架钉进了博客这一个领域。同一句话在三个不同的高度落地——生成是概率性的，验证是确定性的。

这一篇也是 abloq 锁定的

这篇文章是用 abloq 的 writing Quest 写的。以上面展示的 insight.yaml 作种子播种（scan），领取撰稿提示词（next）写正文，提交（submit）让它通过门。出处章节是否越过阈值、引用 URL 是否真能访问、规范的所有 claim 是否在正文中对应——这些判定不是由人眼，而是由机器做的。

撰稿智能体无法 REVIEW 自己的文章。REVIEW 必须由另一个上下文的审阅者撰写，而 review-record 规则确定性地检查那道隔离。从结构上排除谄媚的判定者——让这篇文章无法自我吹捧的那道装置，正是这篇文章所阐释的那条原理。

当约束可验证、违规有定义、且能够强制时，系统就会收敛。博客也不例外。

reins —— Quest CLI 只留下领域，ratchet 交给框架 —— abloq 的门所立足的确定性门引擎。
如何制作 Quest CLI —— 让机器判定完成的原理（why）与骨架（how）。
huma —— 不跳过端点的 ratchet —— 把同一个 ratchet 应用到 API 测试领域的案例。
Ratchet Pattern —— 通过多少就锁多少、阻止回归的模式。
‘完成’由谁定义 —— 把完成判定移交给无法 cheese 的机器门。
GEO：让 AI 引用你的文章 —— abloq 可见性层的理论基础。

参考文献

Aggarwal, P. et al. (2024). “GEO: Generative Engine Optimization.” KDD 2024. arXiv:2311.09735 —— 添加出处、统计、引用文能定量提高生成引擎内可见性的测量。abloq 可见性运营的根据。
Stechly, K., Valmeekam, K., & Kambhampati, S. (2024). “On the Self-Verification Limitations of Large Language Models.” arXiv:2402.08115 —— 自我验证几乎提升不了性能 → 完成判定权限必须交给确定性机器的理由。
Koster, M., Illyes, G., Zeller, H., & Sassman, L. (2022). “Robots Exclusion Protocol.” RFC 9309 —— 30 年惯例成为 IETF 标准的案例（robots.txt 示例的出处）。