Über die Schönheit

Über die Schönheit Image: AI generated

70 % Ordnung, 30 % Komplexität

Wenn man das Schöne zerlegt, ist es erstaunlich regelmäßig.

Bachs Fugen folgen streng den Regeln des Kontrapunkts. Le Corbusiers Architektur steht auf einem modularen Raster. Der Goldene Schnitt der Typografie, die Harmonielehre der Musik, die Perspektive der Malerei — das meiste an der Schönheit ist Mathematik.

Die Fraktalforschung hat dies quantifiziert. Die fraktale Dimension, die der Mensch am schönsten empfindet, liegt bei D ≈ 1,3 (Spehar et al. 2003, Taylor et al. 2011). Wenn D=1,0 vollkommene Ordnung und D=2,0 vollkommenes Chaos ist, dann sind 1,3 etwa 70 % Ordnung und 30 % Komplexität. In Naturlandschaften, mathematischen Fraktalen, Pollocks Gemälden — bei Kindern wie bei Erwachsenen — wurde dasselbe Ergebnis wiederholt bestätigt. Beim Betrachten von D=1,3-Mustern erholt sich der Stress 60 % schneller.

Auch die Musik weist auf dasselbe Verhältnis hin. Voss & Clarke (1978) fanden heraus, dass der Mensch zwischen weißem Rauschen (vollkommen zufällig) und braunem Rauschen (übermäßig korreliert) konsequent das rosa Rauschen (1/f) — den exakten mathematischen Mittelpunkt zwischen Vorhersagbarkeit und Überraschung bevorzugt.

Ist also Ordnung allein schon schön? Nein.

Bach ist nicht groß, weil er den Kontrapunkt einhielt, sondern weil er über dem Kontrapunkt eine Note an eine unerwartete Stelle setzte. Le Corbusier ist nicht groß, weil er das Raster einhielt, sondern weil er über dem Raster eine einzige Säule verdrehte. Jazz ist schön, weil über der festen Form der Akkordfolge die Improvisation steht.

70 % Ordnung schaffen das Fundament, 30 % Komplexität schaffen die Schönheit. Komplexität ohne Ordnung ist Lärm, Ordnung ohne Komplexität ist Langeweile.

Design ist verifizierbar

Der Satz „Design ist subjektiv" stimmt nur zur Hälfte.

Beurteilbar (70 %)	Nicht beurteilbar (30 %)
In einem 4-Spalten-Raster eine leere Spalte bei 1+3	Bewusste Asymmetrie im Hero-Bereich
Abstand von 13px in einem 8px-System	Off-Grid-Platzierung zur Betonung
Farbkontrast unter 4,5:1	Niedrigkontrast-Wahl für die Stimmung
Schriftgröße nicht in der Type-Scale	Bewusste Größenabweichung beim Titel
z-index außerhalb der deklarierten Ebene	—

Die linke Seite kann die Maschine vollständig beurteilen. Regeln existieren deklarativ, und man prüft, ob die Umsetzung diesen Regeln folgt. Das hat dieselbe Struktur, wie go test Code verifiziert.

Die rechte Seite entscheidet der Mensch. Aber wenn er entschieden hat, macht er es explizit.

@allow-break: "bewusste Asymmetrie im Hero-Bereich"

Was diese Annotation tut: Sie erklärt der Maschine „dies ist kein Bug, sondern Absicht". Nun rührt die Maschine diese Ausnahme nicht an und verifiziert nur die verbleibenden 70 % der Ordnung.

57 : 23 : 20

Deque Systems hat das Ergebnis einer Analyse von rund 300.000 Barrierefreiheits-Problemen auf über 13.000 Seiten veröffentlicht (Deque, 2021):

Bereich	Anteil	Beurteilende Instanz
Vollautomatisch erkennbar	57 %	Maschine (deterministische Regeln)
Halbautomatisch (KI-gestützt) erkennbar	23 %	KI + Maschine (Mustererkennung + Regeln)
Nur vom Menschen beurteilbar	20 %	Mensch

Die 57 % sind der Bereich der Ordnung mit klaren Regeln. Farbkontrast unter 4,5:1, fehlende Alternativtexte, keine Tastaturzugänglichkeit — die Maschine beurteilt das, ohne zu fragen.

Die 20 % sind der Bereich der Komplexität, den nur der Mensch beurteilen kann. „Ist dieser Ablauf intuitiv?", „Vermittelt dieser Alternativtext tatsächlich die Bedeutung?" — das lässt sich nur beantworten, wenn man den Kontext versteht.

Die 23 % sind die Grenze. Ein Bereich, der von Regeln nicht vollständig erfasst wird, aber erfasst werden kann, wenn die KI das Muster erkennt. Hier beurteilt die KI anhand des Kontexts: „Ist das bewusste Asymmetrie oder ein Fehler?"

Anthropics Evals-Framework („Demystifying Evals for AI Agents", 2026) spiegelt genau diese drei Schichten wider. Es teilt die Bewerter in drei Arten ein: code-basiert, KI-basiert, menschenbasiert. Und die offizielle Empfehlung lautet:

„Verwende so weit wie möglich einen deterministic (code-based) grader, einen LLM grader nur unterstützend, wenn nötig, und einen human grader nur zur Kalibrierung."

Anthropic selbst räumt die Überlegenheit der deterministischen Verifikation ein. Die Empfehlung „so weit wie möglich code-based" verweist auf den 57-%-Bereich. Im 23-%-Grenzbereich, den der LLM grader übernimmt, vermittelt die KI zwischen Ordnung und Komplexität. Die verbleibenden 20 % entscheidet der Mensch.

Eine Rasterverletzung muss man dem LLM nicht vorlegen. Das ist der 57-%-Bereich. Eine bewusste Asymmetrie muss man dem LLM auch nicht vorlegen. Das sind die 20 %, die der Mensch bereits entschieden hat. Was die KI braucht, sind die 23 % dazwischen — der Grenzbereich, in dem es Regeln gibt, aber Kontext nötig ist.

Sperre die feste Form, erlaube das Formlose

Im Code funktioniert diese Struktur bereits.

filefunc  — sperrt die Codestruktur mit 22 Regeln. Ausnahme: //filefunc:allow
yongol    — sperrt die Schichtenkonsistenz mit 10 SSOT. Ausnahme: expliziter Override
Hurl      — sperrt das API-Verhalten als plain text. Keine Ausnahme (Verhalten darf sich nicht ändern)

Wendet man dieselbe Struktur auf Design an:

Design-System-SSOT → deklariert Raster, Type-Scale, Farben, Abstände
Verifikations-CLI  → mechanisches Urteil, ob die Umsetzung dem SSOT folgt
@allow-break       → erlaubt bewusste Abweichung explizit
Ratchet            → kein Rückschritt unter eine bestandene Verifikation

Dokumente, Musik, Video — in jedem schöpferischen Bereich, in dem feste Regeln existieren, gilt dasselbe Prinzip.

Die 70 % jedes Bereichs

Reins Engineering ist kein KI-Coding-Werkzeug. Es ist das Prinzip, die Ordnung deterministisch einzusperren und nur die Komplexität dem Menschen zu überlassen.

Es begann beim Coding. Das Coding wurde nur zum ersten Beweis.

„Kunst ist frei" ist das Vorurteil von Menschen, die keine künstlerische Ausbildung erhalten haben. Der Roman folgt der Drei-Akt-Struktur, der Andeutung und ihrer Auflösung, der Konsistenz der Perspektive, der Konsistenz der Zeitform. Die Malerei folgt der Komposition, der Farbtheorie, der Struktur der Helligkeitswerte, der Perspektive. Die Musik folgt der Harmonielehre, dem Kontrapunkt, der Form. Analysiert man die 28.000 Harmonie-Label von Beethovens Streichquartetten, folgen sie einem Potenzgesetz — wenige Regeln beherrschen das meiste (Moss et al. 2019). Picasso beherrschte die klassische Zeichnung perfekt, bevor er den Kubismus schuf. Coltrane spielte Standards tausende Male, bevor er Free Jazz machte. Schöpfung heißt, die Regeln vollständig zu verinnerlichen und sie dann bewusst zu brechen; ohne Regeln zu beginnen ist Lärm.

Die Grenze des Anwendungsbereichs von Reins Engineering ist zugleich der Anteil der Ordnung. Die Fraktalforschung zeigt, dass dieser Anteil überall über 70 % liegt.

Was der Mensch tun muss, ist nicht, die 70 % einzuhalten. Es ist, die 30 % zu entscheiden. Den Rest hält die Maschine ein.

Frage

Wie viel Prozent ist Ordnung in dem, was du erschaffst?

Verifiziert die Maschine diese Ordnung?

Oder prüft der Mensch sie jedes Mal mit eigenen Augen?

Glaubst du, dass „Kunst frei ist"?

Frag Picasso.

Quellen

Fraktale und ästhetische Präferenz

Spehar, Clifford, Newell & Taylor, “Universal aesthetic of fractals”, Computers & Graphics 27 (2003) — Präferenz für D=1,3~1,5 in Natur, Mathematik und Malerei gleichermaßen
Taylor, Spehar et al., “Perceptual and Physiological Responses to Jackson Pollock’s Fractals”, Frontiers in Human Neuroscience 5:60 (2011) — 60 % schnellere Stresserholung bei D=1,3
Aks & Sprott, “Quantifying Aesthetic Preference for Chaotic Patterns” (1996) — Durchschnittliche fraktale Dimension bevorzugter Muster F=1,26
Robles et al., “A shared fractal aesthetic across development”, Humanities and Social Sciences Communications (2020) — Präferenz für mittlere Komplexität bei Kindern wie Erwachsenen

Musik und Informationstheorie

Voss & Clarke, “1/f noise in music”, J. Acoustical Society of America 63 (1978) — Rosa Rauschen (1/f) als mathematischer Mittelpunkt zwischen Vorhersagbarkeit und Überraschung
Cheung et al., “Uncertainty and Surprise Jointly Predict Musical Pleasure”, Current Biology 29 (2019) — Analyse von 80.000 Akkorden. Geringe Unsicherheit + hohe Überraschung = maximales Vergnügen
Moss et al., “Statistical Characteristics of Tonal Harmony”, PLOS ONE (2019) — Beethovens 28.000 Harmonie-Label folgen einem Potenzgesetz
Manaris et al., “Zipf’s Law, Music Classification, and Aesthetics”, Computer Music Journal 29(1) (2005) — Ästhetisch angenehme Musik folgt dem Zipf-Mandelbrot-Gesetz

Ästhetische Messtheorie

Birkhoff, Aesthetic Measure, Harvard University Press (1933) — M = O/C. Der erste Versuch, Schönheit mathematisch zu quantifizieren
Berlyne, Aesthetics and Psychobiology (1971) — Umgekehrte U-Kurve: mittlere Komplexität ergibt maximales Vergnügen
Chmiel & Schubert, “Back to the inverted-U for music preference”, Psychology of Music 45(2) (2017) — 87,7 % von 57 Studien stützen das Modell der umgekehrten U-Kurve
Schmidhuber, “Driven by Compression Progress”, arXiv:0812.4360 (2009) — Interessantheit = erste Ableitung des Kompressionsfortschritts

Neurowissenschaft

Ishizu & Zeki, “Toward A Brain-Based Theory of Beauty”, PLOS ONE 6(7) (2011) — Sowohl musikalische als auch visuelle Schönheit aktiviert den medialen orbitofrontalen Kortex (mOFC)
Vessel, Starr & Rubin, “The brain on art”, Frontiers in Human Neuroscience 6:66 (2012) — Aktivierung des Default-Mode-Netzwerks (DMN) bei der bewegendsten Kunst
Reber, Schwarz & Winkielman, “Processing Fluency and Aesthetic Pleasure”, Personality and Social Psychology Review 8 (2004) — Je höher die Verarbeitungsflüssigkeit, desto positiver die ästhetische Reaktion
Dibot et al., “Sparsity in an artificial neural network predicts beauty”, PLOS Computational Biology 19(12) (2023) — Die Sparsität der Neuronen erklärt 28~47 % der Varianz der Schönheit

Architektur und Design

Alexander, A Pattern Language (1977) / The Nature of Order (2002-2005) — „Schönheit ist objektiv, wahrnehmbar und reproduzierbar"
Salingaros, “Life and Complexity in Architecture From a Thermodynamic Analogy” — L = T × H. Komplex, aber harmonisch, damit das Lebensgefühl maximiert wird
Muller-Brockmann, Grid Systems in Graphic Design (1981) — „Macht man die Struktur explizit, gewinnt das Design an Kraft"
WCAG 2.1, Contrast Minimum (2018) — AA 4,5:1, AAA 7:1. Vollständig mechanisch verifizierbar

KI-Evaluation und LLM-as-Judge

Anthropic, Demystifying Evals for AI Agents (2026) — „Verwende so weit wie möglich einen code-based grader"
Zheng et al., Judging LLM-as-a-Judge (2023) — Positionsverzerrung, Langtext-Verzerrung, Selbstverstärkungs-Verzerrung
Ye et al., Justice or Prejudice?, ICLR 2025 — 12 latente Verzerrungen von LLM-Richtern
Zhou et al., IFEval (2023) — Bewertung verifizierbarer Anweisungen durch deterministische Programme
Deque Systems, Automated Testing Study (2021) — Automatisierte Tests allein finden 57 % der Barrierefreiheits-Probleme, mit IGT 80 %