abloq — ein agentenbetriebener Blog, dessen Verifikation die Maschine sperrt

abloq — ein agentenbetriebener Blog, dessen Verifikation die Maschine sperrt Image: AI generated

how-make-quest handelte davon, wie man eine Quest-CLI mit bloßen Händen baut, und reins extrahierte dieses Invariante als Framework. Dieser Text ist die nächste Stufe jener Linie — ein Werkzeug, das denselben Satz in eine einzige Domain rammt, abloq (Agentic blog Quest).

Texte kommen heraus, man kann ihnen nur nicht trauen

Wer schon einmal einem Agenten einen Blog übergeben hat, weiß es. Texte kommen heraus. Wirft man ihm nur ein Thema hin, sammelt er Material, stapelt Absätze und legt einen plausiblen Beitrag vor. Das eigentliche Problem liegt woanders — dass man ihm nicht trauen kann.

Der Agent erfindet Quellen. Er rammt nicht existierende URLs in die Fußnoten und hängt themenfremde Seiten als Zitate an. Heimlich hebt er den lastmod eines gar nicht geänderten Textes an, damit er frisch wirkt. Bittet man ihn, einen Text zu überarbeiten, fasst er das front matter und das Layout des Nachbartextes gleich mit an. So muss der Mensch am Ende alles erneut lesen. Doch wenn der Mensch ohnehin jeden Text Zeile für Zeile prüft, war die Übergabe von vornherein sinnlos. Die Automatisierung hat lediglich neue Prüfarbeit erzeugt.

Das verschwindet nicht, indem man das Modell größer macht. Solange man es sein eigenes Werk beurteilen lässt, findet es mit steigender Fähigkeit nur umso besser die Lücken des Urteils.

Der Mensch schreibt ein einziges Blatt — insight.yaml

abloqs Antwort ist die Arbeitsteilung: Die Erzeugung darf probabilistisch sein, die Verifikation muss deterministisch sein. Die nicht-deterministische Arbeit des Prosaschreibens leistet der Agent, doch ob das Erzeugnis besteht, entscheidet die Maschine.

Deshalb schreibt der Mensch nur ein einziges Blatt — die Insight-Spezifikation, insight.yaml. Thema, Standpunkt und die zu behandelnden Behauptungen (claims) werden in einer Form notiert, die die Maschine abgleichen kann.

# insight.yaml — alles, was der Mensch schreibt
topic: "robots.txt — 30년 관행이 표준이 되기까지"
stance: "robots.txt는 접근 제어 장치가 아니라 신호다"
claims:
  - id: rep-standardized-2022
    text: "robots.txt 관행은 1994년에 시작됐지만 IETF 표준(RFC 9309)이 된 것은 2022년이다"
    requires_source: true
    anchors: ["RFC 9309", "1994"]

Die hier notierten claims werden zum Maßstab des Erstellungs-Gates. Eine Behauptung, die nicht in der Spezifikation steht, kann nicht zum Hauptinhalt des Textes werden, und eine Behauptung, die in der Spezifikation steht, muss im Fließtext eine Entsprechung haben. Materialrecherche, Erstellung, Überarbeitung, Übersetzung, Veröffentlichung und Auffrischung sind danach allesamt Sache des Agenten.

blog.yaml — die vollständige Deklaration eines Blogs

Ist die Spezifikation der SSOT eines einzelnen Textes, so ist blog.yaml der SSOT eines Blogs. Sie fasst Site, Sprachen, Sektionen, die kanonische Struktur des Textes, die GEO-Schwellen und das Deployment in einer einzigen Datei.

site: { baseURL: https://example.com, title: My Blog }
languages: [en, ko, ja]          # erstes Element = Standardsprache
sections: [tech, opinion]
structure:
  order: [image, attribution, body, related, sources, changelog]
geo: { min_sources: 1, freshness_days: 90 }

Daraus werden hugo.toml, robots.txt, llms.txt, sitemap (hreflang), JSON-LD und die Gate-Regel-Parameter allesamt abgeleitet. Solange sich blog.yaml nicht ändert, kann kein Text das Gate umgehen — die Beschränkung ist ein Vertrag. Eine Drift, bei der von Hand abgeschriebene Konfigurationsdateien voneinander abweichen, wird strukturell unmöglich.

FAIL ist keine Meinung, sondern eine Tatsache

Reicht der Agent einen Text ein (submit), urteilt das Gate. Unten steht ein echtes Betriebsprotokoll — als der Agent die Quellen-Sektion ausließ und eine nicht erreichbare URL als Zitat anhängte:

en/tech/robots-exclusion-protocol -> FAIL
  - min-sources: content/en/tech/robots-exclusion-protocol.md:1
    actual="sources section missing — geo.min_sources requires >= 1"
  - citation-exists: content/en/tech/robots-exclusion-protocol.md:19
    actual="https://www.robotstxt.org/orig.html is not reachable (HTTP 403)"

FAIL ist keine Meinung wie “das ist irgendwie komisch”. Es ist eine Tatsache (Fact), in die Ort (Datei:Zeile) und Erwartungswert gerammt sind. Zu korrigieren ist keine Vermutung, sondern jene eine Tatsache. Der Agent konvergiert mit diesem Feedback, und erst wenn die korrigierte Einreichung alle Regeln besteht, sperrt die Maschine PASS.

Hier wirkt das Paradox aus how-make-quest erneut. Das Modell schmeichelt — es befolgt Anweisungen brav. Bei Meinungen ist Schmeichelei Gift, doch bei Tatsachen ist Schmeichelei ein Aktivposten. Speist man die Tatsache zurück, nimmt gerade das schmeichelnde Modell jene Tatsache umso bereitwilliger an und konvergiert.

Was gesperrt ist, lässt sich nicht zurücknehmen — das ratchet

Der Kern des Gates ist nicht das Urteil, sondern die Irreversibilität. Ein einmal gesperrtes PASS rutscht nicht zurück. Selbst wenn der Agent der nächsten Session denselben Text ruiniert, kann er nicht unter die Basislinie sinken.

Deshalb mag der Agent wegwerfbar sein, doch der Fortschritt akkumuliert. Auch wenn der Kontext verfliegt, das Modell wechselt und die Session abreißt, bleibt die gesperrte Stufe gesperrt. Das ist das ratchet — es sperrt nur so viel, wie bestanden wurde, und das Gesperrte erlaubt keine Rückkehr. Es ist zugleich der Grund, die Befugnis des Fertigstellungsurteils nicht einem probabilistischen LLM, sondern einer deterministischen Maschine zu geben. Dass Selbstverifikation die Leistung kaum hebt, ist bereits gemessene Tatsache, und solange LLM-as-Judge strukturell unmöglich ist, muss der Richter Code sein.

Fünf Quests, jede mit einem Gate geschlossen

abloq belässt nur die nicht-deterministische Arbeit am Prosatext als Quest. Detektion, Erzeugung, Messung und externe API-Aufrufe leistet deterministischer Code, und der Agent verrichtet nur die fünf Tätigkeiten des Schreibens. Jede Quest wird mit einem Gate geschlossen.

Quest	Auslöser	Gate (Kern)
writing	menschliches insight.yaml	jedes Spezifikationselement hat eine Entsprechung im Fließtext · Verifikation der realen Existenz der Zitate · Quellen ≥ Schwelle
translation	neuer Text + reale Inhaltsänderung	strukturverlustfrei (translation-parity) + slug-Übereinstimmung über alle Sprachen + Build mit 0 Fehlern
refresh	Frische-Scanner-Queue	reale Inhaltsänderung begleitet · Sperre der Auffrischung leeren lastmod (honest-lastmod)
evidence	Behauptung-Quelle-Scanner-Queue	Quellen ≥ Schwelle · neue Zitate real existent · keine einzige Zeichenänderung an Behauptungen außerhalb der Queue
cluster	Cluster-Scanner-Queue	Tag existiert in der taxonomy · 0 verwaiste Tags · interne Links ≥ Schwelle

Die cheese-Abwehr ist über alle Quests hinweg gemeinsam. Bewahrung des front matter, Byte-Übereinstimmung zwischen Gate-Urteil und Speicherabbild, Verbot von Dateiänderungen außerhalb des Queue-Item-Bereichs. Der Agent ruft externe APIs nicht direkt auf — Nebenwirkungen wie Archivierung und Indexierung werden über die Quittungen des Backends abgewickelt.

Die Messung bestimmt die nächste Arbeit — GEO ist Betrieb

Ob die KI deinen Text zitiert, wird nicht direkt beobachtet. abloq misst es über drei Proxy-Schichten — die Crawl-Schicht (KI-Bot-Hits in den CloudFront-Logs, deterministisch), die Index-Schicht (GSC-Impressions- und Klick-Verlauf, deterministisch) und die Zitat-Schicht (durch periodisches Ausführen eines Standard-Abfragesatzes werden Zitate in KI-Antworten als Trend protokolliert; nicht-deterministisch und daher nicht gegated).

Der Kern ist, dass die Messung dort nicht endet. Das Messergebnis wird zum Gewicht der Prioritäts-Queue und bestimmt die Eingabe der nächsten Quest. Veraltete Texte fallen in die refresh-Queue, quellenlose Behauptungen in die evidence-Queue, isolierte Texte in die cluster-Queue. Ein ratchet, bei dem die Messung die Arbeit bestimmt — deshalb ist GEO kein Zustand, sondern Betrieb. Kein Score, den man einmal optimiert und beendet, sondern eine fortlaufend drehende Schleife. Dass die Faktoren, die Zitate anheben (Quellen, Statistiken, Zitate), die Sichtbarkeit bedeutsam steigern, hat die Forschung zur Generative Engine Optimization quantitativ gezeigt.

Auf reins — die Linie

abloqs Gate beginnt nicht auf dem nackten Boden. Es steht auf der deterministischen Gate-Engine reins. reins liefert ratchet, Befehlsgerüst (scan/next/submit), Aggregation und export, und abloq implementiert nur das Gate der Blog-Domain (den Regelsatz aus Struktur, Beleg und Policy).

Die Linie ist klar. how-make-quest lehrte das Prinzip, eine Quest mit bloßen Händen zu bauen, reins extrahierte jenes Prinzip als Framework, und abloq rammte jenes Framework in eine einzige Domain — den Blog. Derselbe Satz landet dreimal auf unterschiedlicher Höhe — Erzeugung probabilistisch, Verifikation deterministisch.

Auch diesen Text hat abloq gesperrt

Diesen Text habe ich mit abloqs writing-Quest geschrieben. Das oben gezeigte insight.yaml diente als Saatgut zum Seeden (scan), ich empfing den Erstellungs-Prompt (next), schrieb den Fließtext und reichte ihn ein (submit), um das Gate zu bestehen. Ob die Quellen-Sektion die Schwelle überschreitet, ob die Zitat-URLs tatsächlich erreichbar sind, ob jeder claim der Spezifikation eine Entsprechung im Fließtext hat — dieses Urteil fällte nicht das menschliche Auge, sondern die Maschine.

Der Erstellungs-Agent kann seinen eigenen Text nicht REVIEWen. Den REVIEW verfasst zwingend ein Prüfer aus einem anderen Kontext, und die Regel review-record prüft jene Isolation deterministisch. Den schmeichelnden Richter strukturell auszuschließen — die Vorrichtung, die diesen Text daran hindert, sich selbst zu loben, ist genau das Prinzip, das dieser Text erklärt.

Ist das Versprechen verifizierbar, die Verletzung definiert und erzwingbar, dann konvergiert das System. Auch ein Blog ist keine Ausnahme.

Weiterführende Lektüre (extern)

abloq — GitHub-Repository — der Framework-Kern, der Gate-Regelsatz und die Quest-Packs (MIT).
reins — GitHub-Repository — die Gate-Engine, auf der abloq steht (MIT).
llms.txt-Vorschlag — die Konvention eines Site-Index für die KI.

Quellen

Aggarwal, P. et al. (2024). “GEO: Generative Engine Optimization.” KDD 2024. arXiv:2311.09735 — die Messung, dass das Hinzufügen von Quellen, Statistiken und Zitaten die Sichtbarkeit innerhalb generativer Engines quantitativ steigert. Die Grundlage von abloqs Sichtbarkeitsbetrieb.
Stechly, K., Valmeekam, K., & Kambhampati, S. (2024). “On the Self-Verification Limitations of Large Language Models.” arXiv:2402.08115 — Selbstverifikation hebt die Leistung kaum → der Grund, die Befugnis des Fertigstellungsurteils einer deterministischen Maschine zu geben.
Koster, M., Illyes, G., Zeller, H., & Sassman, L. (2022). “Robots Exclusion Protocol.” RFC 9309 — der Fall, in dem eine 30 Jahre alte Praxis zum IETF-Standard wurde (die Quelle des robots.txt-Beispiels).