约束即契约

人类最初的约定

十万年前,某人用手指指向某物并发出了声音。 听到这声音的另一个人想到了同样的东西。

这就是语言的起源。

将"那个东西"称为"狮子"的约定。 没有这个约定,两个人生活在同一世界却看见不同的世界。 有了约定,一个人的经验就能传递给另一个人。

语言是人类最初的契约。


文字是跨越时间的契约

五千年前,美索不达米亚的某人将楔形符号压入湿润的泥板。 目的是记录粮食库存。

语言会消逝,但记录留存。 有了记录,官僚制度成为可能,法律成为可能,国家成为可能。

文字是将当下的约定传递到未来的装置。 今日订立的契约若要在明日依然有效,就需要文字。

语言创造了部落。 文字创造了国家。


法治:用鲜血写就的约定

人类社会是一个密度问题。

在一个150人的部落里,彼此认识对方的面孔。 违背约定,所有人都知道。 单靠社会压力就能维持秩序。

在一个万人城市里,彼此不认识面孔。 违背约定,无人知晓。 社会压力失效。

因此法律成为必要。

法律是将约定文字化的产物。 “做了这件事,就会有这样的结果。” 所有人都在同一规则之下。 规则可以机械地被验证。 违反行为有明确定义。 违反行为必然产生后果。

这个系统运转起来花了数千年。 革命、战争、屠杀、妥协。 人类用鲜血写就了这份约定。

其结果是80亿人类在同一颗星球上共存。 并不完美。但它在运作。 没有法治,这种密度是不可能的。


法治的三个条件

法治之所以运作,不是因为法律聪明。 而是因为满足了三个条件。

1. 可验证。 能够判定法律是否被违反。 判定依据的不是法官的直觉,而是条文与证据。 判定程序有明确定义。

2. 违反行为有明确定义。 什么被允许、什么被禁止,都有明文规定。 不是"不要做坏事", 而是"不得实施第50条第1款所规定的行为"。 是离散的。要么违反,要么不违反。

3. 可强制执行。 违反行为必然产生后果。 没有后果的约定不是约定,而是愿望。

这三个条件具有令人惊叹的普适性。


相同的模式,不同的领域

领域约定验证违反定义强制
人类社会法律审判条文刑罚/赔偿
编程类型系统编译器类型错误拒绝编译
代码格式gofmtgofmt -d格式不符CI 失败
代码结构filefuncvalidate22条规则违反ERROR
知识表示GEUL 规范mechanical verification规范不符拒绝进入 context

所有运转中的系统都有约定。 约定可验证、违反有定义、可强制执行。

没有这些的系统——就是混沌。


LLM 没有约定

2026年,向 AI 代码 agent 下达"改善代码"的指令, agent 会修改一些东西。

但是:

  • 什么时候结束?不知道。
  • 结果是否充分?没有判定标准。
  • 再次运行会得到相同结果吗?不会。

这与没有法律的社会相同。 每个人按自己的判断行动,结果没有标准,每次都不同。

“代码质量"是一个光谱。 光谱没有终止条件。 没有终止条件就无法保证收敛。

这是人治。 依赖明智的君王(聪明的模型)。 君王明智则好,否则就不好。


约束带来收敛

filefunc 定义了22个约定。

一文件一函数。深度不超过2。注解必填。 control 是 sequence、selection、iteration 之一。

这些约定:

  • 可验证。 filefunc validate 机械地作出判定。无需 LLM。
  • 违反有明确定义。 ERROR 或通过。不是光谱。
  • 可强制执行。 必须修改代码直到 ERROR 为 0。

满足这三个条件后,LLM 只需执行 while ERROR > 0: fix 循环, 就能将任意代码库收敛到约定被遵守的状态。

LLM 的角色不是裁判者,而是执行者。 什么是违反,由约定(validate)说了算; 违反是否已消除,也由约定(validate)说了算。 LLM 只做修复约定所指出的违反这一件事。

不是君王统治,而是法律统治。 这就是法治。


混沌与秩序的黄金比例

没有约定就是混沌。 代码没有结构,函数相互混杂,深度无限加深。 AI agent 每次读取全部内容,每次产生不同结果。

约定过多就是压迫。 规定一切,灵活性消失。 对三行函数强制十行注解,本末倒置。

filefunc 的22条规则找到了中间点。 充分约束但不过度的那个点。

证据:1,275个函数收敛到三种控制结构。 顺序、选择、循环。Böhm-Jacopini 在1966年证明的三种结构。 22个约定收敛到数学分类, 这本身就是约定不多不少的证据。

既非混沌也非压迫的状态。 充分自由中的充分秩序。 这就是黄金比例。


第三种语言

语言创造了部落。人与人之间的约定。 文字创造了国家。当下与未来之间的约定。

第三种语言将创造什么。

GEUL 是人工智能与人工智能之间的约定。 也是人工智能与人类之间可验证的约定。

SIDX 是意义的约定。相同的比特模式具有相同的含义。 16位流是格式的约定。网络、存储、AI 共享相同的单元。 source、confidence、time 是信任的约定。元数据内嵌于结构中,无法省略。 mechanical verification 是约定履行的验证。违反规范的信息无法进入 context。

自然语言中没有"无效句子"的概念。 GEUL 中有。 “无效"有明确定义,这本身就是约定存在的证据。


先在代码中证明

同一原理适用于代码与知识两个领域。

但代码在先。

代码有编译器。有 AST。有类型系统。 “有效代码"与"无效代码"之间的边界已经存在。 在此之上追加22个约定,是自然而然的。

自然语言知识没有这个基础。 “有效句子"这个概念本身就不存在。 GEUL 必须从零开始建立这个基础。

先在容易的地方证明,再向困难的地方扩展。 filefunc 在代码中证明,GEUL 向知识扩展。

这就是工程学。


提醒人类的事

问题很简单。

我们已经发明了法治。 这是用鲜血写就的约定。 正是因为这份约定,80亿人类才能在这巨大的密度中共存。

LLM 也不例外。

合理的约束就是约定。 有了约定,混沌与秩序才能达到黄金比例。 约定可验证、违反有定义、可强制执行, 任何系统都能收敛。

正如人类社会所经历的。 正如代码所经历的。 正如知识将要经历的。

不需要新的发明。 只需将已经发明的东西应用到新的领域。

设计约定。 那么它就会收敛。