
70 % Ordnung, 30 % Komplexität
Wenn man das Schöne zerlegt, ist es erstaunlich regelmäßig.
Bachs Fugen folgen streng den Regeln des Kontrapunkts. Le Corbusiers Architektur steht auf einem modularen Raster. Der Goldene Schnitt der Typografie, die Harmonielehre der Musik, die Perspektive der Malerei — das meiste an der Schönheit ist Mathematik.
Die Fraktalforschung hat dies quantifiziert. Die fraktale Dimension, die der Mensch am schönsten empfindet, liegt bei D ≈ 1,3 (Spehar et al. 2003, Taylor et al. 2011). Wenn D=1,0 vollkommene Ordnung und D=2,0 vollkommenes Chaos ist, dann sind 1,3 etwa 70 % Ordnung und 30 % Komplexität. In Naturlandschaften, mathematischen Fraktalen, Pollocks Gemälden — bei Kindern wie bei Erwachsenen — wurde dasselbe Ergebnis wiederholt bestätigt. Beim Betrachten von D=1,3-Mustern erholt sich der Stress 60 % schneller.
Auch die Musik weist auf dasselbe Verhältnis hin. Voss & Clarke (1978) fanden heraus, dass der Mensch zwischen weißem Rauschen (vollkommen zufällig) und braunem Rauschen (übermäßig korreliert) konsequent das rosa Rauschen (1/f) — den exakten mathematischen Mittelpunkt zwischen Vorhersagbarkeit und Überraschung bevorzugt.
Ist also Ordnung allein schon schön? Nein.
Bach ist nicht groß, weil er den Kontrapunkt einhielt, sondern weil er über dem Kontrapunkt eine Note an eine unerwartete Stelle setzte. Le Corbusier ist nicht groß, weil er das Raster einhielt, sondern weil er über dem Raster eine einzige Säule verdrehte. Jazz ist schön, weil über der festen Form der Akkordfolge die Improvisation steht.
70 % Ordnung schaffen das Fundament, 30 % Komplexität schaffen die Schönheit. Komplexität ohne Ordnung ist Lärm, Ordnung ohne Komplexität ist Langeweile.
Design ist verifizierbar
Der Satz „Design ist subjektiv" stimmt nur zur Hälfte.
| Beurteilbar (70 %) | Nicht beurteilbar (30 %) |
|---|---|
| In einem 4-Spalten-Raster eine leere Spalte bei 1+3 | Bewusste Asymmetrie im Hero-Bereich |
| Abstand von 13px in einem 8px-System | Off-Grid-Platzierung zur Betonung |
| Farbkontrast unter 4,5:1 | Niedrigkontrast-Wahl für die Stimmung |
| Schriftgröße nicht in der Type-Scale | Bewusste Größenabweichung beim Titel |
| z-index außerhalb der deklarierten Ebene | — |
Die linke Seite kann die Maschine vollständig beurteilen. Regeln existieren deklarativ, und man prüft, ob die Umsetzung diesen Regeln folgt. Das hat dieselbe Struktur, wie go test Code verifiziert.
Die rechte Seite entscheidet der Mensch. Aber wenn er entschieden hat, macht er es explizit.
@allow-break: "bewusste Asymmetrie im Hero-Bereich"
Was diese Annotation tut: Sie erklärt der Maschine „dies ist kein Bug, sondern Absicht". Nun rührt die Maschine diese Ausnahme nicht an und verifiziert nur die verbleibenden 70 % der Ordnung.
57 : 23 : 20
Deque Systems hat das Ergebnis einer Analyse von rund 300.000 Barrierefreiheits-Problemen auf über 13.000 Seiten veröffentlicht (Deque, 2021):
| Bereich | Anteil | Beurteilende Instanz |
|---|---|---|
| Vollautomatisch erkennbar | 57 % | Maschine (deterministische Regeln) |
| Halbautomatisch (KI-gestützt) erkennbar | 23 % | KI + Maschine (Mustererkennung + Regeln) |
| Nur vom Menschen beurteilbar | 20 % | Mensch |
Die 57 % sind der Bereich der Ordnung mit klaren Regeln. Farbkontrast unter 4,5:1, fehlende Alternativtexte, keine Tastaturzugänglichkeit — die Maschine beurteilt das, ohne zu fragen.
Die 20 % sind der Bereich der Komplexität, den nur der Mensch beurteilen kann. „Ist dieser Ablauf intuitiv?", „Vermittelt dieser Alternativtext tatsächlich die Bedeutung?" — das lässt sich nur beantworten, wenn man den Kontext versteht.
Die 23 % sind die Grenze. Ein Bereich, der von Regeln nicht vollständig erfasst wird, aber erfasst werden kann, wenn die KI das Muster erkennt. Hier beurteilt die KI anhand des Kontexts: „Ist das bewusste Asymmetrie oder ein Fehler?"
Anthropics Evals-Framework („Demystifying Evals for AI Agents", 2026) spiegelt genau diese drei Schichten wider. Es teilt die Bewerter in drei Arten ein: code-basiert, KI-basiert, menschenbasiert. Und die offizielle Empfehlung lautet:
„Verwende so weit wie möglich einen deterministic (code-based) grader, einen LLM grader nur unterstützend, wenn nötig, und einen human grader nur zur Kalibrierung."
Anthropic selbst räumt die Überlegenheit der deterministischen Verifikation ein. Die Empfehlung „so weit wie möglich code-based" verweist auf den 57-%-Bereich. Im 23-%-Grenzbereich, den der LLM grader übernimmt, vermittelt die KI zwischen Ordnung und Komplexität. Die verbleibenden 20 % entscheidet der Mensch.
Eine Rasterverletzung muss man dem LLM nicht vorlegen. Das ist der 57-%-Bereich. Eine bewusste Asymmetrie muss man dem LLM auch nicht vorlegen. Das sind die 20 %, die der Mensch bereits entschieden hat. Was die KI braucht, sind die 23 % dazwischen — der Grenzbereich, in dem es Regeln gibt, aber Kontext nötig ist.
Sperre die feste Form, erlaube das Formlose
Im Code funktioniert diese Struktur bereits.
filefunc — sperrt die Codestruktur mit 22 Regeln. Ausnahme: //filefunc:allow
yongol — sperrt die Schichtenkonsistenz mit 10 SSOT. Ausnahme: expliziter Override
Hurl — sperrt das API-Verhalten als plain text. Keine Ausnahme (Verhalten darf sich nicht ändern)
Wendet man dieselbe Struktur auf Design an:
Design-System-SSOT → deklariert Raster, Type-Scale, Farben, Abstände
Verifikations-CLI → mechanisches Urteil, ob die Umsetzung dem SSOT folgt
@allow-break → erlaubt bewusste Abweichung explizit
Ratchet → kein Rückschritt unter eine bestandene Verifikation
Dokumente, Musik, Video — in jedem schöpferischen Bereich, in dem feste Regeln existieren, gilt dasselbe Prinzip.
Die 70 % jedes Bereichs
Reins Engineering ist kein KI-Coding-Werkzeug. Es ist das Prinzip, die Ordnung deterministisch einzusperren und nur die Komplexität dem Menschen zu überlassen.
Es begann beim Coding. Das Coding wurde nur zum ersten Beweis.
„Kunst ist frei" ist das Vorurteil von Menschen, die keine künstlerische Ausbildung erhalten haben. Der Roman folgt der Drei-Akt-Struktur, der Andeutung und ihrer Auflösung, der Konsistenz der Perspektive, der Konsistenz der Zeitform. Die Malerei folgt der Komposition, der Farbtheorie, der Struktur der Helligkeitswerte, der Perspektive. Die Musik folgt der Harmonielehre, dem Kontrapunkt, der Form. Analysiert man die 28.000 Harmonie-Label von Beethovens Streichquartetten, folgen sie einem Potenzgesetz — wenige Regeln beherrschen das meiste (Moss et al. 2019). Picasso beherrschte die klassische Zeichnung perfekt, bevor er den Kubismus schuf. Coltrane spielte Standards tausende Male, bevor er Free Jazz machte. Schöpfung heißt, die Regeln vollständig zu verinnerlichen und sie dann bewusst zu brechen; ohne Regeln zu beginnen ist Lärm.
Die Grenze des Anwendungsbereichs von Reins Engineering ist zugleich der Anteil der Ordnung. Die Fraktalforschung zeigt, dass dieser Anteil überall über 70 % liegt.
Was der Mensch tun muss, ist nicht, die 70 % einzuhalten. Es ist, die 30 % zu entscheiden. Den Rest hält die Maschine ein.
Frage
Wie viel Prozent ist Ordnung in dem, was du erschaffst?
Verifiziert die Maschine diese Ordnung?
Oder prüft der Mensch sie jedes Mal mit eigenen Augen?
Glaubst du, dass „Kunst frei ist"?
Frag Picasso.
Verwandte Beiträge
Intern
- Reins Engineering — KI mit Zügeln — Ein Engineering-Ansatz, der die 70 % Ordnung deterministisch einsperrt
- filefunc — ein Konzept pro Datei — Die Annotation
//filefunc:allow= explizite Deklaration einer bewussten Ausnahme - Die Schmeichel-Verzerrung der KI ist ein Business-Feature — Warum ein LLM kein ästhetischer Richter sein kann
- Feedback-Topologie statt Modell-IQ — Gleiches Modell, andere Umgebung, anderes Ergebnis
- Was es heißt, Systeme zu bauen, in denen Agenten arbeiten können — Nicht nur Code. Auch Design
Extern
- Dieter Rams, Good Design — „Nothing must be arbitrary or left to chance."
- Tim Brown, More Meaningful Typography — Modulare Skala: aus einem einzigen Verhältnis entsteht die gesamte Typografie
- Josef Muller-Brockmann, Grid Systems in Graphic Design — Der Vater des Rastersystems. „Macht man die Struktur explizit, gewinnt das Design an Kraft."
- Le Corbusier, Le Modulor — Vereint Körperproportionen + Goldenen Schnitt + Fibonacci zu einem einzigen mathematischen System für die gesamte Architektur
- Daniel DeStefanis, Design Lint — Ein Linting-Plugin, das in Figma Ebenen ohne angewandte Design-Tokens automatisch erkennt
- Toptal, Design Constraints Are Not Restraints — Beschränkungen sind keine Unterdrückung, sondern ein Katalysator der Kreativität
- Sciforce, Computational Aesthetics — Die Geschichte der mathematischen Quantifizierung von Schönheit, von Birkhoff (1933) bis zu modernen Algorithmen
Quellen
Fraktale und ästhetische Präferenz
- Spehar, Clifford, Newell & Taylor, “Universal aesthetic of fractals”, Computers & Graphics 27 (2003) — Präferenz für D=1,3~1,5 in Natur, Mathematik und Malerei gleichermaßen
- Taylor, Spehar et al., “Perceptual and Physiological Responses to Jackson Pollock’s Fractals”, Frontiers in Human Neuroscience 5:60 (2011) — 60 % schnellere Stresserholung bei D=1,3
- Aks & Sprott, “Quantifying Aesthetic Preference for Chaotic Patterns” (1996) — Durchschnittliche fraktale Dimension bevorzugter Muster F=1,26
- Robles et al., “A shared fractal aesthetic across development”, Humanities and Social Sciences Communications (2020) — Präferenz für mittlere Komplexität bei Kindern wie Erwachsenen
Musik und Informationstheorie
- Voss & Clarke, “1/f noise in music”, J. Acoustical Society of America 63 (1978) — Rosa Rauschen (1/f) als mathematischer Mittelpunkt zwischen Vorhersagbarkeit und Überraschung
- Cheung et al., “Uncertainty and Surprise Jointly Predict Musical Pleasure”, Current Biology 29 (2019) — Analyse von 80.000 Akkorden. Geringe Unsicherheit + hohe Überraschung = maximales Vergnügen
- Moss et al., “Statistical Characteristics of Tonal Harmony”, PLOS ONE (2019) — Beethovens 28.000 Harmonie-Label folgen einem Potenzgesetz
- Manaris et al., “Zipf’s Law, Music Classification, and Aesthetics”, Computer Music Journal 29(1) (2005) — Ästhetisch angenehme Musik folgt dem Zipf-Mandelbrot-Gesetz
Ästhetische Messtheorie
- Birkhoff, Aesthetic Measure, Harvard University Press (1933) — M = O/C. Der erste Versuch, Schönheit mathematisch zu quantifizieren
- Berlyne, Aesthetics and Psychobiology (1971) — Umgekehrte U-Kurve: mittlere Komplexität ergibt maximales Vergnügen
- Chmiel & Schubert, “Back to the inverted-U for music preference”, Psychology of Music 45(2) (2017) — 87,7 % von 57 Studien stützen das Modell der umgekehrten U-Kurve
- Schmidhuber, “Driven by Compression Progress”, arXiv:0812.4360 (2009) — Interessantheit = erste Ableitung des Kompressionsfortschritts
Neurowissenschaft
- Ishizu & Zeki, “Toward A Brain-Based Theory of Beauty”, PLOS ONE 6(7) (2011) — Sowohl musikalische als auch visuelle Schönheit aktiviert den medialen orbitofrontalen Kortex (mOFC)
- Vessel, Starr & Rubin, “The brain on art”, Frontiers in Human Neuroscience 6:66 (2012) — Aktivierung des Default-Mode-Netzwerks (DMN) bei der bewegendsten Kunst
- Reber, Schwarz & Winkielman, “Processing Fluency and Aesthetic Pleasure”, Personality and Social Psychology Review 8 (2004) — Je höher die Verarbeitungsflüssigkeit, desto positiver die ästhetische Reaktion
- Dibot et al., “Sparsity in an artificial neural network predicts beauty”, PLOS Computational Biology 19(12) (2023) — Die Sparsität der Neuronen erklärt 28~47 % der Varianz der Schönheit
Architektur und Design
- Alexander, A Pattern Language (1977) / The Nature of Order (2002-2005) — „Schönheit ist objektiv, wahrnehmbar und reproduzierbar"
- Salingaros, “Life and Complexity in Architecture From a Thermodynamic Analogy” — L = T × H. Komplex, aber harmonisch, damit das Lebensgefühl maximiert wird
- Muller-Brockmann, Grid Systems in Graphic Design (1981) — „Macht man die Struktur explizit, gewinnt das Design an Kraft"
- WCAG 2.1, Contrast Minimum (2018) — AA 4,5:1, AAA 7:1. Vollständig mechanisch verifizierbar
KI-Evaluation und LLM-as-Judge
- Anthropic, Demystifying Evals for AI Agents (2026) — „Verwende so weit wie möglich einen code-based grader"
- Zheng et al., Judging LLM-as-a-Judge (2023) — Positionsverzerrung, Langtext-Verzerrung, Selbstverstärkungs-Verzerrung
- Ye et al., Justice or Prejudice?, ICLR 2025 — 12 latente Verzerrungen von LLM-Richtern
- Zhou et al., IFEval (2023) — Bewertung verifizierbarer Anweisungen durch deterministische Programme
- Deque Systems, Automated Testing Study (2021) — Automatisierte Tests allein finden 57 % der Barrierefreiheits-Probleme, mit IGT 80 %