GEO：AIにあなたの記事を引用させる方法

GEO：AIにあなたの記事を引用させる方法 Image generated by Google Gemini

GEO（Generative Engine Optimization）とは、ChatGPT、Perplexity、Google AI OverviewなどのAI検索エンジンがあなたのコンテンツを引用するよう最適化する戦略だ。 AEO（Answer Engine Optimization）、AI SEO、LLM検索最適化とも呼ばれる。

検索が変わった――AI SEO時代の始まり

Googleで検索すれば青いリンクが10個表示されていた。今はAIが答えを生成する。ChatGPT、Perplexity、Google AI Overview——ユーザーはリンクをクリックせずに答えを得る。

Gartnerは2026年までに従来の検索ボリュームが25%減少すると予測している。米国人口の31.3%がすでに生成AI検索を利用している。

問題はこれだ：AIが生成した回答にあなたのコンテンツが引用されなければ、存在しないのと同じだ。

Generative Engine Optimization（GEO）は、この新しいゲームのルールだ。

GEO vs SEO vs AEO――何が違うのか

従来のSEOはGoogleのランキングゲームだった。キーワード、バックリンク、メタタグ。GEOは別のゲームだ。

	SEO	GEO
目標	SERP順位	AI回答内の引用
成功指標	表示回数、クリック、CTR	引用率、ブランド推薦頻度
主要シグナル	バックリンク、キーワード	エンティティの明確性、出典引用、クロスプラットフォーム一貫性
トラフィックモデル	クリック → サイト訪問	ゼロクリック（訪問なしで消費）

驚くべきデータがある。AI Overview引用の83%がGoogleオーガニック上位10位圏外のページから来ている。ChatGPT最多引用ページの28.3%はGoogleでのオーガニック可視性がゼロだ。従来のSEOランキングとAI引用は別のゲームだ。

では、AIは何を引用するのか？

1. インフラ：Hugo + CloudFront + robots.txt + llms.txt

AIクローラーがあなたのコンテンツに到達できなければ、引用もない。最初の条件は技術インフラだ。

静的サイトジェネレーター（Hugo）+ S3 + CloudFront

静的HTMLはクローラーにとって最も高速でクリーンなソースだ。SPAはJavaScriptレンダリングが必要なため、AIクローラーがスキップすることが多い
CloudFront CDNは世界中どこからでも高速なレスポンスを提供する。AIクローラーも速度をシグナルとして使用する
Hugoの多言語ビルドはhreflangタグを自動生成する。12言語 = 12のエントリーポイント

サイトマップ

XMLサイトマップは基本だ。しかしGEO時代にはさらに2つが必要になる：

llms.txt — サイトルートに配置するMarkdownベースのファイル。robots.txtが「どこをクロールするか」なら、llms.txtは「何が重要なコンテンツか」をガイドする。Anthropic、Hugging Face、Perplexityが先行採用
Schema.org JSON-LD — Article、Person、SoftwareSourceCodeスキーマ。AIクローラーに「このページは何か」というチートシートを渡すこと

robots.txtでAIクローラーを明示的に許可：

2026年時点で主要なAIクローラーボットは5つのカテゴリに分かれる：

カテゴリ	説明	ブロック時の影響
訓練クローラー	LLM訓練データの収集	モデルの長期知識から除外
検索インデクサー	AI検索回答用のインデックス	AI検索結果から消滅
ユーザートリガーフェッチ	ユーザーの質問時にリアルタイムフェッチ	会話中に参照不可
エージェント	AIがユーザーに代わってウェブを閲覧	エージェントサービスから除外
データ収集	大規模ウェブデータ収集	該当データセットから除外

主要ボット一覧：

ボット	所有者	用途
GPTBot	OpenAI	モデル訓練
OAI-SearchBot	OpenAI	ChatGPT検索インデキシング
ChatGPT-User	OpenAI	ユーザーリアルタイムフェッチ
ClaudeBot	Anthropic	モデル訓練
Claude-SearchBot	Anthropic	Claude検索インデキシング
Claude-User	Anthropic	ユーザーリアルタイムフェッチ
Google-Extended	Google	Gemini訓練
Applebot-Extended	Apple	Apple Intelligence訓練
Meta-ExternalAgent	Meta	Llama訓練 + Meta AI
PerplexityBot	Perplexity	AI検索
bingbot	Microsoft	Bing + Copilot
CCBot	Common Crawl	オープンデータセット（ほぼすべてのLLMが使用）
Bytespider	ByteDance	Doubao訓練（robots.txtを無視、ブロック推奨）

核心：訓練ボットと検索/フェッチボットを区別する必要がある。 訓練ボットをブロックしても、検索ボットを許可すればAI回答には引用される。両方をブロックすればAIの世界から消える。

llms.txt — robots.txtが「どこをクロールするか」なら、llms.txtは「何が重要なコンテンツか」をガイドする。Markdownベースでサイトルートに配置。Anthropic、Hugging Face、Perplexityが先行採用。メニュー・広告・スクリプトのノイズを除去し、AIのコンテキストウィンドウに適した精製コンテンツを提供する。

2. サイトマップとhreflang：AIが読む意味論的マップ

従来のサイトマップはURL一覧だ。GEO時代のサイトマップは意味論的マップだ。

<url>
  <loc>https://www.parkjunwoo.com/opinion/reins-engineering/</loc>
  <lastmod>2026-05-27</lastmod>
  <changefreq>weekly</changefreq>
</url>

さらに：

hreflangリンク：同じ記事の12言語バージョンが相互リンク。AIは多言語の権威を高く評価する
lastmodの正確性：AI引用の76.4%が直近30日以内に更新されたページから来ている。3ヶ月未満のコンテンツが引用される確率は3倍。lastmodを偽装すると逆効果
カテゴリ構造：/opinion/、/tech/、/lecture/ — フラットな構造より意味のある階層がAIにコンテキストを与える

Google Search Consoleにサイトマップを送信するのは基本だ。しかしそれだけでは不十分だ。

3. Wayback MachineとGoogle Search Console：コンテンツ原本の証明

Wayback Machineは1996年からウェブのスナップショットを保存している。AIにとってこれは時間的記憶だ。

なぜ重要か：

2026年5月に「Ratchet Pattern」を最初に定義した記事を公開すれば、Wayback Machineにそのスナップショットが残る
6ヶ月後、誰かが同じ概念をより大きなプラットフォームで書いたとしても、時間的証拠が原著者を指し示す
AIが出典を決定するとき、最初の公開時点は間接的な権威シグナルとして機能する

実行：

新しい記事の公開後、Wayback Machineに手動保存をリクエスト（web.archive.org/save/）
Google Search ConsoleにURLインデキシングをリクエスト
両方にタイムスタンプが記録される

注意：2026年現在、241のサイトがWayback Machineへのアクセスをブロックしている（AI企業による著作権回避の懸念）。個人ブログにとってこれはむしろ機会だ——大手メディアがアーカイブから撤退したことで、個人コンテンツの相対的比重が上がる。

4. 出典引用とトピック権威：LLMが信頼するコンテンツの条件

GEO原論文（Aggarwal et al., KDD 2024）が明らかにした可視性向上戦略トップ3：

戦略	可視性向上
引用文の追加（Quotation）	+41%
統計の追加（Statistics）	+32%
出典の明示（Cite Sources）	+30%

キーワードスタッフィングはGEOでは無意味か逆効果だ。AIはキーワードではなく根拠を見る。

論文引用が重要な理由：

AIは「主張」と「根拠のある主張」を区別する。「開発者の時間の42%が技術的負債に費やされている」は主張だ。「開発者の時間の42%が技術的負債に費やされている（Stripe, The Developer Coefficient, 2018）」は根拠だ
根拠のある文はAIが自身の回答に引用する際の信頼コストが低い。根拠のない文はAIが検証する必要があるためスキップする
4つ以上のAIプラットフォームで引用されたサイトはChatGPT出現率が2.8倍高い

関連記事管理とタグ付け：

タグは人間のためではない。AIのためだ。

一貫したタグ体系：「Reins Engineering」「Ratchet Pattern」「SSOT」——同じタグが複数の記事にまたがって繰り返されると、AIはトピック権威（topical authority）を認識する
内部リンク：記事内で関連記事をリンクすると、AIクローラーがトピッククラスターを把握する。孤立した記事より接続された記事が引用される
相互引用：自分の記事同士を引用するのも有効だ。「この概念の基礎はRatchet Patternで定義した」

5. X、Reddit、Hacker News：ブランド検索ボリュームを作るソーシャル戦略

X/Twitterの利用規約はサードパーティのAI訓練を明示的に禁止している。つまり、Xに投稿した内容がChatGPTの訓練データに直接入ることはない。

しかしソーシャル活動は間接経路でAI可視性に貢献する：

ブランド検索ボリュームがLLM引用の最強予測変数だ（相関係数0.334、バックリンクより高い）。

経路はこうだ：

Xスレッド → 人々がGoogleで「yongol」を検索 → ブランド検索ボリューム上昇 → AIが「yongol」を引用に値するエンティティとして認識

実際にparkjunwoo.comの5月データがこれを示している：

「yongol」Google検索：14回表示、5回クリック、平均順位3.1
yongol GitHubクローン：ユニーク316名
流入経路：t.co（X）4名 → GitHub → ブログ

Xで直接リンクを共有するよりも、概念を検索させることがGEOにはより効果的だ。

earned mediaの威力：

LLM引用全体の48%がearned media（報道、レビュー、第三者による言及）から来ている。自社コンテンツはわずか23%だ。つまり、他者にあなたを言及させることは自分の記事を最適化するより2倍効果的だ。

Reddit、Hacker News、dev.toでプロジェクトが言及されれば → 該当プラットフォームのAIクロールを通じて → LLMがエンティティを学習する。

チェックリスト

インフラ
├── Hugo静的サイト + S3 + CloudFront
├── robots.txtでAIクローラーを許可
├── llms.txt作成（主要コンテンツのキュレーション）
├── Schema.org JSON-LD（Article、Person）
└── XMLサイトマップ + hreflang

コンテンツ
├── すべての主張に出典を明示（+30%可視性）
├── 統計をインラインで挿入（+32%）
├── 比較テーブルを使用（AIパース最適）
├── lastmodを正確に維持（30日以内の更新 → 引用率76.4%）
└── 3ヶ月以上経過した記事を定期更新（引用確率3倍）

接続
├── 一貫したタグ体系（トピック権威）
├── 内部リンク（トピッククラスター）
├── 論文・外部出典の引用（信頼コスト削減）
└── 新記事 → Wayback Machine + GSCに提出

ソーシャル
├── Xスレッドで概念検索を誘導（ブランド検索ボリューム）
├── Reddit/HNでearned mediaを発生
└── リンク直接共有より概念拡散がGEOに有利

このサイトのGEO実行事例

この記事で説明した戦略はparkjunwoo.comで実際に実行中だ：

robots.txt — 25のAIクローラーを明示的に許可、Bytespiderをブロック
llms.txt — 主要コンテンツをAIコンテキストウィンドウに合わせてキュレーション
Reins Engineering記事コレクション — トピッククラスターのハブ
12言語多言語ビルド — hreflang自動生成、言語別エントリーポイント
すべての記事に論文出典 — インライン統計 + 学術引用でファクト密度を確保
公開直後にWayback Machine + GSCに提出 — 時間的な原本証明

Google, Optimizing your website for generative AI features on Google Search (2026) — Google公式AI検索最適化ガイド
Cyrus Shepard, AI Citation Ranking Factors Analysis — 54件の研究メタ分析、23のAI引用ランキング要素を定量化
Seer Interactive, AIO Impact on Google CTR: 2026 Update — 53ブランド、24.3億インプレッション追跡。AI Overviewがあるとき CTR -61%
Discovered Labs, AI Citation Patterns: How ChatGPT, Claude, and Perplexity Choose Sources — AI引用のわずか12%がGoogleトップ10と重複
Ahrefs, Generative Engine Optimization: Growth Strategies and Metrics — 30万キーワード分析。ウェブメンションがバックリンクに対してAI Overview露出で3:1で優勢
Datos/SparkToro, State of Search Q1 2026 — クリックストリームベースのAI検索シェア追跡
Rand Fishkin, Search Happens Everywhere — 41サイト分析、検索はGoogleだけではない
Go Fish Digital, GEO Case Study: 3X’ing Leads — AIリファラルが従来検索に対して25倍高いコンバージョン率
Search Engine Land, How schema markup fits into AI search — スキーママークアップとAI検索の誇張なき分析
Lily Ray, The Vicious Cycle of SEO — GEOスパムの短命さへの警告

出典

論文

Aggarwal et al., GEO: Generative Engine Optimization, KDD 2024 — 引用文+41%、統計+32%、出典明示+30%の可視性向上
Xu et al., Measuring Google AI Overviews (2026) — 55,393クエリ分析。AIO引用ドメインの30%がオーガニック1ページに不在
Fang et al., Recency Bias in LLM-Based Reranking, SIGIR-AP 2025 — 7モデルすべてが最新コンテンツを一貫して昇格
Zhang et al., Citation Selection to Citation Absorption (2026) — ChatGPT/Google AIO/Perplexityの引用パターン定量比較
Algaba et al., LLMs Reflect Human Citation Patterns, NAACL 2025 — LLMは高引用論文をより強く選好（Matthew effect）
arXiv:2602.18455, AI Search Impact on Wikipedia Traffic (2026) — AIOがWikipediaトラフィックを15%減少（DID因果分析）
Yu et al., Structural Feature Engineering for GEO (2026) — コンテンツ構造自体が引用確率に影響
Tian et al., Diagnosing Citation Failures in GEO (2026) — コンテンツ5%修正で引用率40%向上
Baack, Critical Analysis of Common Crawl, FAccT 2024 — LLM学習データの核心構成要素とバイアス
Strauss et al., The Attribution Crisis in LLM Search (2025) — Geminiの92%がクリック可能な引用を未提供