
70%的秩序,30%的复杂性
把美的事物拆解开来,会发现它惊人地规则。
Bach 的赋格严格遵循对位法的规则。Le Corbusier 的建筑立足于模度网格之上。排版的黄金比例、音乐的和声学、绘画的透视法——美的绝大部分都是数学。
分形研究将这一点量化了。人类感到最美的分形维度是 D ≈ 1.3(Spehar et al. 2003,Taylor et al. 2011)。当 D=1.0 代表完全的秩序、D=2.0 代表完全的混沌时,1.3 即是约70%的秩序与30%的复杂性。在自然风景、数学分形、Pollock 的绘画中,以及在儿童与成人身上,都反复确认了同样的结果。当人们看到 D=1.3 的图案时,压力恢复的速度快了60%。
音乐也指向同样的比例。Voss & Clarke(1978)发现,在白噪声(完全随机)与棕噪声(过度相关)之间,人类始终偏爱粉红噪声(1/f)——可预测性与意外性之间精确的数学中点。
那么仅凭秩序就美吗?不。
Bach 的伟大不在于他遵守了对位法,而在于他在对位法之上把某个音放在了出人意料的位置。Le Corbusier 的伟大在于他在网格之上扭转了某一根柱子。爵士乐之美,在于和弦进行这一定式之上还有即兴。
70%的秩序构筑根基,30%的复杂性创造美。 没有秩序的复杂性是噪声,没有复杂性的秩序是无聊。
设计是可验证的
“设计是主观的”这句话只对了一半。
| 可判定的(70%) | 不可判定的(30%) |
|---|---|
| 四格网格里 1+3 留出空格 | hero 区块的刻意非对称 |
| 在 8px 系统里出现 13px 的间距 | 为强调而做的脱离网格的排布 |
| 色彩对比度低于 4.5:1 | 为营造氛围而选择的低对比度 |
| 字号不在排版比例尺里 | 标题刻意偏离尺寸 |
| z-index 超出已声明的层级 | — |
左侧全部可以由机器判定。规则以声明式存在,确认实现是否遵循这些规则——这与 go test 验证代码的结构相同。
右侧由人来决定。但一旦决定了,就要明示出来。
@allow-break: "hero 区块的刻意非对称"
这个注解所做的事:向机器声明“这不是 bug,而是意图”。如此一来,机器便不再碰这个例外,只验证其余70%的秩序。
57 : 23 : 20
Deque Systems 在超过 13,000 个页面上分析了约 300,000 件无障碍问题,得出了一组结果(Deque, 2021):
| 领域 | 比例 | 判定主体 |
|---|---|---|
| 完全自动化即可探测 | 57% | 机器(确定性规则) |
| 半自动(AI 辅助)可探测 | 23% | AI + 机器(模式识别 + 规则) |
| 只有人能判定 | 20% | 人 |
57% 是规则明确的秩序领域。色彩对比度低于 4.5:1、缺少替代文本、键盘无法访问——机器无需发问即可判定。
20% 是只有人才能判断的复杂性领域。“这个流程直观吗?”、“这段替代文本真的传达了含义吗?”——必须理解上下文才能回答。
23% 是边界。 它无法被规则完全捕获,但若 AI 识别出模式便能捕获。这正是 AI 凭借上下文来判断“这是刻意的非对称还是失误?”的地方。
Anthropic 的 Evals 框架(《Demystifying Evals for AI Agents》, 2026)恰恰映照了这三个层级。它把评分者分为三类:基于代码的、基于 AI 的、基于人的。而官方的建议是:
“尽可能使用 deterministic(code-based)grader,LLM grader 仅在必要时作为辅助,human grader 仅用于校准。”
Anthropic 自己就承认了确定性验证的优越性。 “尽可能 code-based”的建议指向的是 57% 的领域。在由 LLM grader 负责的 23% 边界领域里,AI 在秩序与复杂性之间居中调停。其余 20% 由人决定。
没必要为网格违规去询问 LLM——那是 57% 的领域。也没必要为刻意的非对称去询问 LLM——那是人早已决定的 20%。AI 真正需要的是介于两者之间的 23%——有规则、却需要上下文的边界领域。
锁定定式,允许非定式
在代码中,这套结构早已运转。
filefunc — 用 22 条规则锁定代码结构。例外是 //filefunc:allow
yongol — 用 10 个 SSOT 锁定各层的一致性。例外是显式覆盖
Hurl — 用纯文本锁定 API 行为。没有例外(行为不应改变)
把同样的结构应用到设计上:
设计系统 SSOT → 声明网格、排版比例尺、色彩、间距
验证 CLI → 机械判定实现是否遵循 SSOT
@allow-break → 显式允许刻意的偏离
棘轮 → 不可退化到已通过的验证之下
文档、音乐、影像——凡是存在定式规则的一切创作领域,同样的原理都适用。
一切领域的70%
Reins Engineering 不是一款 AI 编程工具。它是确定性地锁定秩序、只把复杂性留给人的原理。
它从编程起步。只不过编程成了第一个实证。
“艺术是自由的”是未受过艺术教育者的偏见。小说遵循三幕结构、伏笔与回收、视角的一致性、时态的一致性。绘画遵循构图、色彩理论、明暗值结构、透视法。音乐遵循和声学、对位法、形式。分析 Beethoven 弦乐四重奏的 28,000 个和声标签,会发现它们遵循幂律——少数规则支配大部分(Moss et al. 2019)。Picasso 在做立体主义之前,已把古典素描做到完美。Coltrane 在玩自由爵士之前,已把标准曲演奏了数千遍。把规则彻底内化后再刻意打破,才是创作;没有规则就开始,那是噪声。
Reins Engineering 的适用范围的极限,恰恰就是秩序的比例。分形研究表明,那个比例在任何地方都在70%以上。
人该做的不是去守那70%。而是去决定那30%。 其余的由机器来守。
提问
在你所创造的东西里,秩序占百分之几?
那份秩序,机器在验证吗?
还是每一次都靠人用眼睛去确认?
你相信“艺术是自由的”吗?
去问问 Picasso。
相关文章
内部
- Reins Engineering — 有缰绳的 AI — 确定性地锁定 70% 秩序的工程方法
- filefunc — 一个文件一个概念 —
//filefunc:allow注解 = 对刻意例外的显式声明 - AI 的奉承偏见是一项商业特性 — 为何 LLM 无法成为审美判定者
- 比模型 IQ 更重要的是反馈拓扑 — 同一模型,不同环境,不同结果
- 打造能让智能体工作的系统意味着什么 — 不只是代码,设计亦然
外部
- Dieter Rams, Good Design — “Nothing must be arbitrary or left to chance.”
- Tim Brown, More Meaningful Typography — 模度比例尺:整套排版皆源自单一比例
- Josef Muller-Brockmann, Grid Systems in Graphic Design — 网格系统之父。“当结构被明示出来,设计便获得力量。”
- Le Corbusier, Le Modulor — 以人体比例 + 黄金比例 + 斐波那契,将整座建筑整合为单一的数学系统
- Daniel DeStefanis, Design Lint — 在 Figma 中自动检出未应用设计令牌的图层的 linting 插件
- Toptal, Design Constraints Are Not Restraints — 约束不是压制,而是创意的催化剂
- Sciforce, Computational Aesthetics — 从 Birkhoff(1933)到现代算法,美的数学量化史
出处
分形与审美偏好
- Spehar, Clifford, Newell & Taylor, “Universal aesthetic of fractals”, Computers & Graphics 27 (2003) — 在自然、数学、绘画中均偏好 D=1.3~1.5
- Taylor, Spehar et al., “Perceptual and Physiological Responses to Jackson Pollock’s Fractals”, Frontiers in Human Neuroscience 5:60 (2011) — 在 D=1.3 时压力恢复快 60%
- Aks & Sprott, “Quantifying Aesthetic Preference for Chaotic Patterns” (1996) — 偏好图案的平均分形维度 F=1.26
- Robles et al., “A shared fractal aesthetic across development”, Humanities and Social Sciences Communications (2020) — 儿童与成人都偏好中等复杂度
音乐与信息论
- Voss & Clarke, “1/f noise in music”, J. Acoustical Society of America 63 (1978) — 粉红噪声(1/f)是可预测性与意外性的数学中点
- Cheung et al., “Uncertainty and Surprise Jointly Predict Musical Pleasure”, Current Biology 29 (2019) — 分析 80,000 个和弦。低不确定性 + 高意外性 = 最大愉悦
- Moss et al., “Statistical Characteristics of Tonal Harmony”, PLOS ONE (2019) — Beethoven 的 28,000 个和声标签遵循幂律
- Manaris et al., “Zipf’s Law, Music Classification, and Aesthetics”, Computer Music Journal 29(1) (2005) — 审美上令人愉悦的音乐遵循 Zipf-Mandelbrot 定律
美的测度理论
- Birkhoff, Aesthetic Measure, Harvard University Press (1933) — M = O/C。以数学量化美的首次尝试
- Berlyne, Aesthetics and Psychobiology (1971) — 倒 U 形曲线:中等复杂性带来最大愉悦
- Chmiel & Schubert, “Back to the inverted-U for music preference”, Psychology of Music 45(2) (2017) — 57 项研究中 87.7% 支持倒 U 形模型
- Schmidhuber, “Driven by Compression Progress”, arXiv:0812.4360 (2009) — 趣味性 = 压缩进展的一阶导数
神经科学
- Ishizu & Zeki, “Toward A Brain-Based Theory of Beauty”, PLOS ONE 6(7) (2011) — 音乐与视觉之美都激活内侧眶额皮层(mOFC)
- Vessel, Starr & Rubin, “The brain on art”, Frontiers in Human Neuroscience 6:66 (2012) — 最令人感动的艺术激活默认模式网络(DMN)
- Reber, Schwarz & Winkielman, “Processing Fluency and Aesthetic Pleasure”, Personality and Social Psychology Review 8 (2004) — 处理流畅度越高,审美反应越正面
- Dibot et al., “Sparsity in an artificial neural network predicts beauty”, PLOS Computational Biology 19(12) (2023) — 神经元稀疏性解释了美的方差的 28~47%
建筑与设计
- Alexander, A Pattern Language (1977) / The Nature of Order (2002-2005) — “美是客观的、可感知的、可再现的”
- Salingaros, “Life and Complexity in Architecture From a Thermodynamic Analogy” — L = T × H。既复杂又和谐,生命感方能最大化
- Muller-Brockmann, Grid Systems in Graphic Design (1981) — “当结构被明示出来,设计便获得力量”
- WCAG 2.1, Contrast Minimum (2018) — AA 4.5:1,AAA 7:1。完全可被机械验证
AI 评估与 LLM-as-Judge
- Anthropic, Demystifying Evals for AI Agents (2026) — “尽可能使用 code-based grader”
- Zheng et al., Judging LLM-as-a-Judge (2023) — 位置偏见、长文偏见、自我强化偏见
- Ye et al., Justice or Prejudice?, ICLR 2025 — LLM 评判者的 12 种潜在偏见
- Zhou et al., IFEval (2023) — 用确定性程序为可验证的指令评分
- Deque Systems, Automated Testing Study (2021) — 仅靠自动化测试发现 57% 的无障碍问题,含 IGT 时为 80%