论美 | PARK JUN WOO

Image: AI generated

70%的秩序，30%的复杂性

把美的事物拆解开来，会发现它惊人地规则。

Bach 的赋格严格遵循对位法的规则。Le Corbusier 的建筑立足于模度网格之上。排版的黄金比例、音乐的和声学、绘画的透视法——美的绝大部分都是数学。

分形研究将这一点量化了。人类感到最美的分形维度是 D ≈ 1.3（Spehar et al. 2003，Taylor et al. 2011）。当 D=1.0 代表完全的秩序、D=2.0 代表完全的混沌时，1.3 即是约70%的秩序与30%的复杂性。在自然风景、数学分形、Pollock 的绘画中，以及在儿童与成人身上，都反复确认了同样的结果。当人们看到 D=1.3 的图案时，压力恢复的速度快了60%。

音乐也指向同样的比例。Voss & Clarke（1978）发现，在白噪声（完全随机）与棕噪声（过度相关）之间，人类始终偏爱粉红噪声（1/f）——可预测性与意外性之间精确的数学中点。

那么仅凭秩序就美吗？不。

Bach 的伟大不在于他遵守了对位法，而在于他在对位法之上把某个音放在了出人意料的位置。Le Corbusier 的伟大在于他在网格之上扭转了某一根柱子。爵士乐之美，在于和弦进行这一定式之上还有即兴。

70%的秩序构筑根基，30%的复杂性创造美。 没有秩序的复杂性是噪声，没有复杂性的秩序是无聊。

设计是可验证的

“设计是主观的”这句话只对了一半。

可判定的（70%）	不可判定的（30%）
四格网格里 1+3 留出空格	hero 区块的刻意非对称
在 8px 系统里出现 13px 的间距	为强调而做的脱离网格的排布
色彩对比度低于 4.5:1	为营造氛围而选择的低对比度
字号不在排版比例尺里	标题刻意偏离尺寸
z-index 超出已声明的层级	—

左侧全部可以由机器判定。规则以声明式存在，确认实现是否遵循这些规则——这与 go test 验证代码的结构相同。

右侧由人来决定。但一旦决定了，就要明示出来。

@allow-break: "hero 区块的刻意非对称"

这个注解所做的事：向机器声明“这不是 bug，而是意图”。如此一来，机器便不再碰这个例外，只验证其余70%的秩序。

57 : 23 : 20

Deque Systems 在超过 13,000 个页面上分析了约 300,000 件无障碍问题，得出了一组结果（Deque, 2021）：

领域	比例	判定主体
完全自动化即可探测	57%	机器（确定性规则）
半自动（AI 辅助）可探测	23%	AI + 机器（模式识别 + 规则）
只有人能判定	20%	人

57% 是规则明确的秩序领域。色彩对比度低于 4.5:1、缺少替代文本、键盘无法访问——机器无需发问即可判定。

20% 是只有人才能判断的复杂性领域。“这个流程直观吗？”、“这段替代文本真的传达了含义吗？”——必须理解上下文才能回答。

23% 是边界。 它无法被规则完全捕获，但若 AI 识别出模式便能捕获。这正是 AI 凭借上下文来判断“这是刻意的非对称还是失误？”的地方。

Anthropic 的 Evals 框架（《Demystifying Evals for AI Agents》, 2026）恰恰映照了这三个层级。它把评分者分为三类：基于代码的、基于 AI 的、基于人的。而官方的建议是：

“尽可能使用 deterministic（code-based）grader，LLM grader 仅在必要时作为辅助，human grader 仅用于校准。”

Anthropic 自己就承认了确定性验证的优越性。 “尽可能 code-based”的建议指向的是 57% 的领域。在由 LLM grader 负责的 23% 边界领域里，AI 在秩序与复杂性之间居中调停。其余 20% 由人决定。

没必要为网格违规去询问 LLM——那是 57% 的领域。也没必要为刻意的非对称去询问 LLM——那是人早已决定的 20%。AI 真正需要的是介于两者之间的 23%——有规则、却需要上下文的边界领域。

锁定定式，允许非定式

在代码中，这套结构早已运转。

filefunc  — 用 22 条规则锁定代码结构。例外是 //filefunc:allow
yongol    — 用 10 个 SSOT 锁定各层的一致性。例外是显式覆盖
Hurl      — 用纯文本锁定 API 行为。没有例外（行为不应改变）

把同样的结构应用到设计上：

设计系统 SSOT  → 声明网格、排版比例尺、色彩、间距
验证 CLI       → 机械判定实现是否遵循 SSOT
@allow-break   → 显式允许刻意的偏离
棘轮           → 不可退化到已通过的验证之下

文档、音乐、影像——凡是存在定式规则的一切创作领域，同样的原理都适用。

一切领域的70%

Reins Engineering 不是一款 AI 编程工具。它是确定性地锁定秩序、只把复杂性留给人的原理。

它从编程起步。只不过编程成了第一个实证。

“艺术是自由的”是未受过艺术教育者的偏见。小说遵循三幕结构、伏笔与回收、视角的一致性、时态的一致性。绘画遵循构图、色彩理论、明暗值结构、透视法。音乐遵循和声学、对位法、形式。分析 Beethoven 弦乐四重奏的 28,000 个和声标签，会发现它们遵循幂律——少数规则支配大部分（Moss et al. 2019）。Picasso 在做立体主义之前，已把古典素描做到完美。Coltrane 在玩自由爵士之前，已把标准曲演奏了数千遍。把规则彻底内化后再刻意打破，才是创作；没有规则就开始，那是噪声。

Reins Engineering 的适用范围的极限，恰恰就是秩序的比例。分形研究表明，那个比例在任何地方都在70%以上。

人该做的不是去守那70%。而是去决定那30%。 其余的由机器来守。

提问

在你所创造的东西里，秩序占百分之几？

那份秩序，机器在验证吗？

还是每一次都靠人用眼睛去确认？

你相信“艺术是自由的”吗？

去问问 Picasso。

内部

Reins Engineering — 有缰绳的 AI — 确定性地锁定 70% 秩序的工程方法
filefunc — 一个文件一个概念 — //filefunc:allow 注解 = 对刻意例外的显式声明
AI 的奉承偏见是一项商业特性 — 为何 LLM 无法成为审美判定者
比模型 IQ 更重要的是反馈拓扑 — 同一模型，不同环境，不同结果
打造能让智能体工作的系统意味着什么 — 不只是代码，设计亦然

外部

Dieter Rams, Good Design — “Nothing must be arbitrary or left to chance.”
Tim Brown, More Meaningful Typography — 模度比例尺：整套排版皆源自单一比例
Josef Muller-Brockmann, Grid Systems in Graphic Design — 网格系统之父。“当结构被明示出来，设计便获得力量。”
Le Corbusier, Le Modulor — 以人体比例 + 黄金比例 + 斐波那契，将整座建筑整合为单一的数学系统
Daniel DeStefanis, Design Lint — 在 Figma 中自动检出未应用设计令牌的图层的 linting 插件
Toptal, Design Constraints Are Not Restraints — 约束不是压制，而是创意的催化剂
Sciforce, Computational Aesthetics — 从 Birkhoff（1933）到现代算法，美的数学量化史

出处

分形与审美偏好

Spehar, Clifford, Newell & Taylor, “Universal aesthetic of fractals”, Computers & Graphics 27 (2003) — 在自然、数学、绘画中均偏好 D=1.3~1.5
Taylor, Spehar et al., “Perceptual and Physiological Responses to Jackson Pollock’s Fractals”, Frontiers in Human Neuroscience 5:60 (2011) — 在 D=1.3 时压力恢复快 60%
Aks & Sprott, “Quantifying Aesthetic Preference for Chaotic Patterns” (1996) — 偏好图案的平均分形维度 F=1.26
Robles et al., “A shared fractal aesthetic across development”, Humanities and Social Sciences Communications (2020) — 儿童与成人都偏好中等复杂度

音乐与信息论

Voss & Clarke, “1/f noise in music”, J. Acoustical Society of America 63 (1978) — 粉红噪声（1/f）是可预测性与意外性的数学中点
Cheung et al., “Uncertainty and Surprise Jointly Predict Musical Pleasure”, Current Biology 29 (2019) — 分析 80,000 个和弦。低不确定性 + 高意外性 = 最大愉悦
Moss et al., “Statistical Characteristics of Tonal Harmony”, PLOS ONE (2019) — Beethoven 的 28,000 个和声标签遵循幂律
Manaris et al., “Zipf’s Law, Music Classification, and Aesthetics”, Computer Music Journal 29(1) (2005) — 审美上令人愉悦的音乐遵循 Zipf-Mandelbrot 定律

美的测度理论

Birkhoff, Aesthetic Measure, Harvard University Press (1933) — M = O/C。以数学量化美的首次尝试
Berlyne, Aesthetics and Psychobiology (1971) — 倒 U 形曲线：中等复杂性带来最大愉悦
Chmiel & Schubert, “Back to the inverted-U for music preference”, Psychology of Music 45(2) (2017) — 57 项研究中 87.7% 支持倒 U 形模型
Schmidhuber, “Driven by Compression Progress”, arXiv:0812.4360 (2009) — 趣味性 = 压缩进展的一阶导数

神经科学

Ishizu & Zeki, “Toward A Brain-Based Theory of Beauty”, PLOS ONE 6(7) (2011) — 音乐与视觉之美都激活内侧眶额皮层（mOFC）
Vessel, Starr & Rubin, “The brain on art”, Frontiers in Human Neuroscience 6:66 (2012) — 最令人感动的艺术激活默认模式网络（DMN）
Reber, Schwarz & Winkielman, “Processing Fluency and Aesthetic Pleasure”, Personality and Social Psychology Review 8 (2004) — 处理流畅度越高，审美反应越正面
Dibot et al., “Sparsity in an artificial neural network predicts beauty”, PLOS Computational Biology 19(12) (2023) — 神经元稀疏性解释了美的方差的 28~47%

建筑与设计

Alexander, A Pattern Language (1977) / The Nature of Order (2002-2005) — “美是客观的、可感知的、可再现的”
Salingaros, “Life and Complexity in Architecture From a Thermodynamic Analogy” — L = T × H。既复杂又和谐，生命感方能最大化
Muller-Brockmann, Grid Systems in Graphic Design (1981) — “当结构被明示出来，设计便获得力量”
WCAG 2.1, Contrast Minimum (2018) — AA 4.5:1，AAA 7:1。完全可被机械验证

AI 评估与 LLM-as-Judge

Anthropic, Demystifying Evals for AI Agents (2026) — “尽可能使用 code-based grader”
Zheng et al., Judging LLM-as-a-Judge (2023) — 位置偏见、长文偏见、自我强化偏见
Ye et al., Justice or Prejudice?, ICLR 2025 — LLM 评判者的 12 种潜在偏见
Zhou et al., IFEval (2023) — 用确定性程序为可验证的指令评分
Deque Systems, Automated Testing Study (2021) — 仅靠自动化测试发现 57% 的无障碍问题，含 IGT 时为 80%