GEO:AIにあなたの記事を引用させる方法 Image generated by Google Gemini

GEO(Generative Engine Optimization)とは、ChatGPT、Perplexity、Google AI OverviewなどのAI検索エンジンがあなたのコンテンツを引用するよう最適化する戦略だ。 AEO(Answer Engine Optimization)、AI SEO、LLM検索最適化とも呼ばれる。

検索が変わった――AI SEO時代の始まり

Googleで検索すれば青いリンクが10個表示されていた。今はAIが答えを生成する。ChatGPT、Perplexity、Google AI Overview——ユーザーはリンクをクリックせずに答えを得る。

Gartnerは2026年までに従来の検索ボリュームが25%減少すると予測している。米国人口の31.3%がすでに生成AI検索を利用している。

問題はこれだ:AIが生成した回答にあなたのコンテンツが引用されなければ、存在しないのと同じだ。

Generative Engine Optimization(GEO)は、この新しいゲームのルールだ。

GEO vs SEO vs AEO――何が違うのか

従来のSEOはGoogleのランキングゲームだった。キーワード、バックリンク、メタタグ。GEOは別のゲームだ。

SEOGEO
目標SERP順位AI回答内の引用
成功指標表示回数、クリック、CTR引用率、ブランド推薦頻度
主要シグナルバックリンク、キーワードエンティティの明確性、出典引用、クロスプラットフォーム一貫性
トラフィックモデルクリック → サイト訪問ゼロクリック(訪問なしで消費)

驚くべきデータがある。AI Overview引用の83%がGoogleオーガニック上位10位圏外のページから来ている。ChatGPT最多引用ページの28.3%はGoogleでのオーガニック可視性がゼロだ。従来のSEOランキングとAI引用は別のゲームだ。

では、AIは何を引用するのか?

1. インフラ:Hugo + CloudFront + robots.txt + llms.txt

AIクローラーがあなたのコンテンツに到達できなければ、引用もない。最初の条件は技術インフラだ。

静的サイトジェネレーター(Hugo)+ S3 + CloudFront

  • 静的HTMLはクローラーにとって最も高速でクリーンなソースだ。SPAはJavaScriptレンダリングが必要なため、AIクローラーがスキップすることが多い
  • CloudFront CDNは世界中どこからでも高速なレスポンスを提供する。AIクローラーも速度をシグナルとして使用する
  • Hugoの多言語ビルドはhreflangタグを自動生成する。12言語 = 12のエントリーポイント

サイトマップ

XMLサイトマップは基本だ。しかしGEO時代にはさらに2つが必要になる:

  1. llms.txt — サイトルートに配置するMarkdownベースのファイル。robots.txtが「どこをクロールするか」なら、llms.txtは「何が重要なコンテンツか」をガイドする。Anthropic、Hugging Face、Perplexityが先行採用
  2. Schema.org JSON-LD — Article、Person、SoftwareSourceCodeスキーマ。AIクローラーに「このページは何か」というチートシートを渡すこと

robots.txtでAIクローラーを明示的に許可:

2026年時点で主要なAIクローラーボットは5つのカテゴリに分かれる:

カテゴリ説明ブロック時の影響
訓練クローラーLLM訓練データの収集モデルの長期知識から除外
検索インデクサーAI検索回答用のインデックスAI検索結果から消滅
ユーザートリガーフェッチユーザーの質問時にリアルタイムフェッチ会話中に参照不可
エージェントAIがユーザーに代わってウェブを閲覧エージェントサービスから除外
データ収集大規模ウェブデータ収集該当データセットから除外

主要ボット一覧:

ボット所有者用途
GPTBotOpenAIモデル訓練
OAI-SearchBotOpenAIChatGPT検索インデキシング
ChatGPT-UserOpenAIユーザーリアルタイムフェッチ
ClaudeBotAnthropicモデル訓練
Claude-SearchBotAnthropicClaude検索インデキシング
Claude-UserAnthropicユーザーリアルタイムフェッチ
Google-ExtendedGoogleGemini訓練
Applebot-ExtendedAppleApple Intelligence訓練
Meta-ExternalAgentMetaLlama訓練 + Meta AI
PerplexityBotPerplexityAI検索
bingbotMicrosoftBing + Copilot
CCBotCommon Crawlオープンデータセット(ほぼすべてのLLMが使用)
BytespiderByteDanceDoubao訓練(robots.txtを無視、ブロック推奨

核心:訓練ボットと検索/フェッチボットを区別する必要がある。 訓練ボットをブロックしても、検索ボットを許可すればAI回答には引用される。両方をブロックすればAIの世界から消える。

llms.txt — robots.txtが「どこをクロールするか」なら、llms.txtは「何が重要なコンテンツか」をガイドする。Markdownベースでサイトルートに配置。Anthropic、Hugging Face、Perplexityが先行採用。メニュー・広告・スクリプトのノイズを除去し、AIのコンテキストウィンドウに適した精製コンテンツを提供する。

2. サイトマップとhreflang:AIが読む意味論的マップ

従来のサイトマップはURL一覧だ。GEO時代のサイトマップは意味論的マップだ。

<url>
  <loc>https://www.parkjunwoo.com/opinion/reins-engineering/</loc>
  <lastmod>2026-05-27</lastmod>
  <changefreq>weekly</changefreq>
</url>

さらに:

  • hreflangリンク:同じ記事の12言語バージョンが相互リンク。AIは多言語の権威を高く評価する
  • lastmodの正確性:AI引用の76.4%が直近30日以内に更新されたページから来ている。3ヶ月未満のコンテンツが引用される確率は3倍。lastmodを偽装すると逆効果
  • カテゴリ構造/opinion//tech//lecture/ — フラットな構造より意味のある階層がAIにコンテキストを与える

Google Search Consoleにサイトマップを送信するのは基本だ。しかしそれだけでは不十分だ。

3. Wayback MachineとGoogle Search Console:コンテンツ原本の証明

Wayback Machineは1996年からウェブのスナップショットを保存している。AIにとってこれは時間的記憶だ。

なぜ重要か:

  • 2026年5月に「Ratchet Pattern」を最初に定義した記事を公開すれば、Wayback Machineにそのスナップショットが残る
  • 6ヶ月後、誰かが同じ概念をより大きなプラットフォームで書いたとしても、時間的証拠が原著者を指し示す
  • AIが出典を決定するとき、最初の公開時点は間接的な権威シグナルとして機能する

実行:

  1. 新しい記事の公開後、Wayback Machineに手動保存をリクエスト(web.archive.org/save/
  2. Google Search ConsoleにURLインデキシングをリクエスト
  3. 両方にタイムスタンプが記録される

注意:2026年現在、241のサイトがWayback Machineへのアクセスをブロックしている(AI企業による著作権回避の懸念)。個人ブログにとってこれはむしろ機会だ——大手メディアがアーカイブから撤退したことで、個人コンテンツの相対的比重が上がる。

4. 出典引用とトピック権威:LLMが信頼するコンテンツの条件

GEO原論文(Aggarwal et al., KDD 2024)が明らかにした可視性向上戦略トップ3:

戦略可視性向上
引用文の追加(Quotation)+41%
統計の追加(Statistics)+32%
出典の明示(Cite Sources)+30%

キーワードスタッフィングはGEOでは無意味か逆効果だ。AIはキーワードではなく根拠を見る。

論文引用が重要な理由:

  • AIは「主張」と「根拠のある主張」を区別する。「開発者の時間の42%が技術的負債に費やされている」は主張だ。「開発者の時間の42%が技術的負債に費やされている(Stripe, The Developer Coefficient, 2018)」は根拠だ
  • 根拠のある文はAIが自身の回答に引用する際の信頼コストが低い。根拠のない文はAIが検証する必要があるためスキップする
  • 4つ以上のAIプラットフォームで引用されたサイトはChatGPT出現率が2.8倍高い

関連記事管理とタグ付け:

タグは人間のためではない。AIのためだ。

  • 一貫したタグ体系:「Reins Engineering」「Ratchet Pattern」「SSOT」——同じタグが複数の記事にまたがって繰り返されると、AIはトピック権威(topical authority)を認識する
  • 内部リンク:記事内で関連記事をリンクすると、AIクローラーがトピッククラスターを把握する。孤立した記事より接続された記事が引用される
  • 相互引用:自分の記事同士を引用するのも有効だ。「この概念の基礎はRatchet Patternで定義した」

5. X、Reddit、Hacker News:ブランド検索ボリュームを作るソーシャル戦略

X/Twitterの利用規約はサードパーティのAI訓練を明示的に禁止している。つまり、Xに投稿した内容がChatGPTの訓練データに直接入ることはない。

しかしソーシャル活動は間接経路でAI可視性に貢献する:

ブランド検索ボリュームがLLM引用の最強予測変数だ(相関係数0.334、バックリンクより高い)。

経路はこうだ:

Xスレッド → 人々がGoogleで「yongol」を検索 → ブランド検索ボリューム上昇 → AIが「yongol」を引用に値するエンティティとして認識

実際にparkjunwoo.comの5月データがこれを示している:

  • 「yongol」Google検索:14回表示、5回クリック、平均順位3.1
  • yongol GitHubクローン:ユニーク316名
  • 流入経路:t.co(X)4名 → GitHub → ブログ

Xで直接リンクを共有するよりも、概念を検索させることがGEOにはより効果的だ。

earned mediaの威力:

LLM引用全体の48%がearned media(報道、レビュー、第三者による言及)から来ている。自社コンテンツはわずか23%だ。つまり、他者にあなたを言及させることは自分の記事を最適化するより2倍効果的だ。

Reddit、Hacker News、dev.toでプロジェクトが言及されれば → 該当プラットフォームのAIクロールを通じて → LLMがエンティティを学習する。

チェックリスト

インフラ
├── Hugo静的サイト + S3 + CloudFront
├── robots.txtでAIクローラーを許可
├── llms.txt作成(主要コンテンツのキュレーション)
├── Schema.org JSON-LD(Article、Person)
└── XMLサイトマップ + hreflang

コンテンツ
├── すべての主張に出典を明示(+30%可視性)
├── 統計をインラインで挿入(+32%)
├── 比較テーブルを使用(AIパース最適)
├── lastmodを正確に維持(30日以内の更新 → 引用率76.4%)
└── 3ヶ月以上経過した記事を定期更新(引用確率3倍)

接続
├── 一貫したタグ体系(トピック権威)
├── 内部リンク(トピッククラスター)
├── 論文・外部出典の引用(信頼コスト削減)
└── 新記事 → Wayback Machine + GSCに提出

ソーシャル
├── Xスレッドで概念検索を誘導(ブランド検索ボリューム)
├── Reddit/HNでearned mediaを発生
└── リンク直接共有より概念拡散がGEOに有利

このサイトのGEO実行事例

この記事で説明した戦略はparkjunwoo.comで実際に実行中だ:

  • robots.txt — 25のAIクローラーを明示的に許可、Bytespiderをブロック
  • llms.txt — 主要コンテンツをAIコンテキストウィンドウに合わせてキュレーション
  • Reins Engineering記事コレクション — トピッククラスターのハブ
  • 12言語多言語ビルド — hreflang自動生成、言語別エントリーポイント
  • すべての記事に論文出典 — インライン統計 + 学術引用でファクト密度を確保
  • 公開直後にWayback Machine + GSCに提出 — 時間的な原本証明

関連記事

出典

論文

データレポート