GEO: So wird Ihr Content von KI zitiert Image generated by Google Gemini

GEO (Generative Engine Optimization) ist eine Strategie zur Optimierung von Inhalten, damit KI-Suchmaschinen sie zitieren. Waehrend traditionelles SEO ein Spiel um Google-Rankings war, geht es bei GEO darum, als Quelle in KI-generierten Antworten aufgenommen zu werden. Auch bekannt als AEO (Answer Engine Optimization), AI SEO oder LLM-Suchoptimierung.

Die Suche hat sich veraendert — der Beginn des AI-SEO-Zeitalters

Man gab eine Anfrage bei Google ein und erhielt zehn blaue Links. Jetzt generiert die KI die Antwort. ChatGPT, Perplexity, Google AI Overview — Nutzer erhalten Antworten, ohne einen einzigen Link anzuklicken.

Gartner prognostiziert bis 2026 einen Rueckgang des traditionellen Suchvolumens um 25 %. 31,3 % der US-Bevoelkerung nutzen bereits generative KI-Suche.

Das Problem ist folgendes: Wenn Ihr Content nicht in KI-generierten Antworten zitiert wird, existiert er praktisch nicht.

Generative Engine Optimization (GEO) definiert die Regeln dieses neuen Spiels.

GEO vs SEO vs AEO — was ist der Unterschied

Traditionelles SEO war ein Google-Ranking-Spiel. Keywords, Backlinks, Meta-Tags. GEO ist ein anderes Spiel.

SEOGEO
ZielSERP-RankingZitation in KI-Antworten
ErfolgsmetrikImpressionen, Klicks, CTRZitationsrate, Haeufigkeit der Markenempfehlung
KernsignalBacklinks, KeywordsEntitaets-Klarheit, Quellenangaben, plattformuebergreifende Konsistenz
Traffic-ModellKlick → SeitenbesuchZero-Click (Konsum ohne Besuch)

Es gibt ueberraschende Daten. 83 % der AI-Overview-Zitate stammen von Seiten ausserhalb der organischen Top 10 bei Google. 28,3 % der am haeufigsten von ChatGPT zitierten Seiten haben eine organische Google-Sichtbarkeit von 0. Traditionelles SEO-Ranking und KI-Zitation sind zwei verschiedene Spiele.

Was zitiert die KI also?

1. Infrastruktur: Hugo + CloudFront + robots.txt + llms.txt

Wenn KI-Crawler Ihren Content nicht erreichen koennen, gibt es keine Zitation. Die erste Bedingung ist die technische Infrastruktur.

Statischer Site-Generator (Hugo) + S3 + CloudFront

  • Statisches HTML ist die schnellste und sauberste Quelle fuer Crawler. SPAs erfordern JavaScript-Rendering, und KI-Crawler ueberspringen sie oft
  • CloudFront CDN bietet weltweit schnelle Antwortzeiten. KI-Crawler nutzen Geschwindigkeit ebenfalls als Signal
  • Hugos mehrsprachiger Build generiert automatisch hreflang-Tags. 12 Sprachen = 12 Einstiegspunkte

Sitemap

Die XML-Sitemap ist die Grundlage. Aber im GEO-Zeitalter werden zwei weitere Elemente benoetigt:

  1. llms.txt — Eine Markdown-Datei im Stammverzeichnis der Website. Wenn robots.txt sagt “wo gecrawlt werden soll”, gibt llms.txt Orientierung zu “welcher Content wichtig ist”. Anthropic, Hugging Face und Perplexity haben es als Vorreiter eingefuehrt
  2. Schema.org JSON-LD — Article-, Person-, SoftwareSourceCode-Schemas. Ein Spickzettel fuer KI-Crawler: “Das ist diese Seite”

Explizite Erlaubnis fuer KI-Crawler in robots.txt:

Stand 2026 lassen sich die wichtigsten KI-Crawler-Bots in 5 Kategorien einteilen:

KategorieBeschreibungAuswirkung bei Blockierung
Training-CrawlerSammlung von LLM-TrainingsdatenAusschluss aus dem Langzeitwissen des Modells
Such-IndexerIndex fuer KI-SuchantwortenVerschwinden aus KI-Suchergebnissen
Nutzer-getriggerter AbrufEchtzeit-Fetch bei NutzeranfragenKeine Referenzierung im Gespraech
AgentenKI durchsucht das Web fuer den NutzerAusschluss von Agenten-Diensten
DatensammlungGrossflaechige WebdatensammlungAusschluss aus dem jeweiligen Datensatz

Liste der wichtigsten Bots:

BotEigentuemerVerwendung
GPTBotOpenAIModell-Training
OAI-SearchBotOpenAIChatGPT-Such-Indexierung
ChatGPT-UserOpenAIEchtzeit-Abruf durch Nutzer
ClaudeBotAnthropicModell-Training
Claude-SearchBotAnthropicClaude-Such-Indexierung
Claude-UserAnthropicEchtzeit-Abruf durch Nutzer
Google-ExtendedGoogleGemini-Training
Applebot-ExtendedAppleApple-Intelligence-Training
Meta-ExternalAgentMetaLlama-Training + Meta AI
PerplexityBotPerplexityKI-Suche
bingbotMicrosoftBing + Copilot
CCBotCommon CrawlOffener Datensatz (von fast allen LLMs genutzt)
BytespiderByteDanceDoubao-Training (ignoriert robots.txt, Blockierung empfohlen)

Der Kern: Training-Bots und Such-/Abruf-Bots muessen unterschieden werden. Selbst wenn Sie Training-Bots blockieren, werden Sie in KI-Antworten zitiert, solange Sie Such-Bots erlauben. Blockieren Sie beide, verschwinden Sie aus der KI-Welt.

llms.txt — Wenn robots.txt sagt “wo gecrawlt werden soll”, gibt llms.txt Orientierung zu “welcher Content wichtig ist”. Markdown-Datei im Stammverzeichnis der Website. Anthropic, Hugging Face und Perplexity haben es als Vorreiter eingefuehrt. Es entfernt Rauschen von Menues, Werbung und Skripten und liefert bereinigten Content, der in das Kontextfenster der KI passt.

2. Sitemaps und hreflang: die semantische Karte fuer die KI

Die traditionelle Sitemap ist eine URL-Liste. Die Sitemap des GEO-Zeitalters ist eine semantische Karte.

<url>
  <loc>https://www.parkjunwoo.com/opinion/reins-engineering/</loc>
  <lastmod>2026-05-27</lastmod>
  <changefreq>weekly</changefreq>
</url>

Ergaenzend dazu:

  • hreflang-Links: Die 12 Sprachversionen desselben Artikels sind miteinander verknuepft. KI bewertet mehrsprachige Autoritaet hoch
  • lastmod-Genauigkeit: 76,4 % der KI-Zitate stammen von Seiten, die innerhalb der letzten 30 Tage aktualisiert wurden. Content unter 3 Monaten wird mit 3-facher Wahrscheinlichkeit zitiert. Faelschung des lastmod wirkt kontraproduktiv
  • Kategoriestruktur: /opinion/, /tech/, /lecture/ — eine sinnvolle Hierarchie gibt der KI mehr Kontext als eine flache Struktur

Die Sitemap bei Google Search Console einzureichen, ist das Minimum. Aber das allein reicht nicht.

3. Wayback Machine und Google Search Console: den Original-Nachweis sichern

Die Wayback Machine archiviert seit 1996 Schnappschuesse des Webs. Fuer die KI ist das ein zeitliches Gedaechtnis.

Warum das wichtig ist:

  • Wenn Sie im Mai 2026 den ersten Artikel veroeffentlicht haben, der das “Ratchet Pattern” definiert, bewahrt die Wayback Machine diesen Schnappschuss
  • Sechs Monate spaeter, selbst wenn jemand dasselbe Konzept auf einer groesseren Plattform verwendet, weist der zeitliche Beweis auf den Originalautor hin
  • Wenn die KI Quellen bestimmt, wirkt das Erstveroeffentlichungsdatum als indirektes Autoritaetssignal

Umsetzung:

  1. Nach Veroeffentlichung eines neuen Artikels eine manuelle Speicheranfrage an die Wayback Machine senden (web.archive.org/save/)
  2. URL-Indexierung in Google Search Console beantragen
  3. An beiden Stellen wird ein Zeitstempel gesetzt

Hinweis: Stand 2026 blockieren 241 Websites den Zugriff auf die Wayback Machine (Bedenken wegen Urheberrechtsumgehung durch KI-Unternehmen). Fuer einen persoenlichen Blog ist das eher eine Chance — in einem Archiv, aus dem sich grosse Medien zurueckziehen, steigt das relative Gewicht individueller Inhalte.

4. Zitationen und thematische Autoritaet (Topical Authority)

Die Top-3-Strategien zur Sichtbarkeitssteigerung laut der GEO-Originalstudie (Aggarwal et al., KDD 2024):

StrategieSichtbarkeitssteigerung
Zitate einfuegen (Quotation)+41 %
Statistiken einfuegen (Statistics)+32 %
Quellen angeben (Cite Sources)+30 %

Keyword-Stuffing ist bei GEO wirkungslos oder kontraproduktiv. KI schaut nicht auf Keywords, sondern auf Belege.

Warum wissenschaftliche Zitate wichtig sind:

  • KI unterscheidet zwischen einer “Behauptung” und einer “belegten Behauptung”. “42 % der Entwicklerzeit wird fuer technische Schulden aufgewendet” ist eine Behauptung. “42 % der Entwicklerzeit wird fuer technische Schulden aufgewendet (Stripe, The Developer Coefficient, 2018)” ist ein Beleg
  • Belegte Saetze haben geringe Vertrauenskosten, wenn die KI sie in ihren Antworten zitiert. Unbelegte Saetze muessen verifiziert werden und werden daher uebersprungen
  • Websites, die auf 4 oder mehr KI-Plattformen zitiert werden, erscheinen 2,8-mal haeufiger in ChatGPT

Verwandte Inhalte und Tagging:

Tags sind nicht fuer Menschen. Sie sind fuer die KI.

  • Konsistentes Tag-System: “Reins Engineering”, “Ratchet Pattern”, “SSOT” — wenn derselbe Tag in mehreren Artikeln vorkommt, erkennt die KI thematische Autoritaet (Topical Authority)
  • Interne Links: Verlinkung verwandter Artikel innerhalb eines Artikels hilft KI-Crawlern, thematische Cluster zu identifizieren. Vernetzte Artikel werden haeufiger zitiert als isolierte
  • Querverweise: Selbstzitation zwischen eigenen Artikeln ist gueltig. “Die Grundlagen dieses Konzepts wurden in Ratchet Pattern definiert”

5. X, Reddit, Hacker News: Soziale Strategien fuer Marken-Suchvolumen

Die Nutzungsbedingungen von X/Twitter verbieten ausdruecklich das KI-Training durch Dritte. Das heisst, auf X veroeffentlichte Inhalte gelangen nicht direkt in die Trainingsdaten von ChatGPT.

Aber soziale Aktivitaet traegt ueber indirekte Wege zur KI-Sichtbarkeit bei:

Das Marken-Suchvolumen ist der staerkste Praediktor fuer LLM-Zitationen (Korrelationskoeffizient 0,334, hoeher als Backlinks).

Der Weg sieht so aus:

X-Thread → Menschen suchen "yongol" bei Google → Marken-Suchvolumen steigt → KI erkennt "yongol" als zitierbare Entitaet

Die Mai-Daten von parkjunwoo.com bestaetigen dies:

  • Google-Suche “yongol”: 14 Impressionen, 5 Klicks, durchschnittliche Position 3,1
  • yongol GitHub-Klone: 316 einzigartige Nutzer
  • Akquisitionspfad: t.co (X) 4 Personen → GitHub → Blog

Anstatt Links direkt auf X zu teilen, ist es fuer GEO effektiver, Menschen dazu zu bringen, das Konzept zu suchen.

Die Kraft von Earned Media:

48 % aller LLM-Zitate stammen aus Earned Media (Presse, Rezensionen, Erwaehnung durch Dritte). Eigener Content macht nur 23 % aus. Das heisst, andere dazu zu bringen, Sie zu erwaehnen, ist doppelt so effektiv wie die Optimierung des eigenen Contents.

Wenn ein Projekt auf Reddit, Hacker News oder dev.to erwaehnt wird → ueber das KI-Crawling dieser Plattformen → lernt das LLM die Entitaet.

Checkliste

Infrastruktur
├── Hugo statische Seite + S3 + CloudFront
├── KI-Crawler in robots.txt erlauben
├── llms.txt erstellen (Kuration der Kerninhalte)
├── Schema.org JSON-LD (Article, Person)
└── XML-Sitemap + hreflang

Content
├── Quelle fuer jede Behauptung angeben (+30 % Sichtbarkeit)
├── Statistiken inline einfuegen (+32 %)
├── Vergleichstabellen verwenden (optimales KI-Parsing)
├── lastmod genau pflegen (Update < 30 Tage → Zitationsrate 76,4 %)
└── Artikel aelter als 3 Monate regelmaessig aktualisieren (3-fache Zitationswahrscheinlichkeit)

Verbindungen
├── Konsistentes Tag-System (thematische Autoritaet)
├── Interne Links (thematische Cluster)
├── Zitation von Studien/externen Quellen (Vertrauenskosten senken)
└── Neuer Artikel → Wayback Machine + GSC-Einreichung

Social
├── X-Threads zur Anregung von Konzeptsuchen (Marken-Suchvolumen)
├── Earned Media auf Reddit/HN generieren
└── Konzeptverbreitung ist fuer GEO vorteilhafter als direktes Teilen von Links

GEO-Umsetzung auf dieser Website

Die in diesem Artikel beschriebenen Strategien werden auf parkjunwoo.com tatsaechlich umgesetzt:

  • robots.txt — 25 KI-Crawler explizit erlaubt, Bytespider blockiert
  • llms.txt — Kerninhalte fuer das Kontextfenster der KI kuratiert
  • Reins Engineering Artikelsammlung — Thematischer Cluster-Hub
  • Mehrsprachiger Build in 12 Sprachen — Automatische hreflang-Generierung, Einstiegspunkte pro Sprache
  • Wissenschaftliche Quellen in jedem Artikel — Inline-Statistiken + akademische Zitate fuer Faktendichte
  • Sofortige Einreichung bei Wayback Machine + GSC nach Veroeffentlichung — Zeitlicher Originalitaetsnachweis

Verwandte Artikel

Quellen

Wissenschaftliche Arbeiten

Datenberichte