第2講

ヒント — これだけ知れば指示できる

ドリフトとは? AIが新機能を追加しながら既存機能をこっそり変えてしまう現象。コードを読まないあなたには発見がほぼ不可能。

なぜ起きるのか? AIに「これ合ってる?」と聞くと58%の確率で「はい」と答える。実際に合っているかどうかとは無関係に。これをおべっか偏向という。

一行原則:意見を与えればおべっかし、事実を与えれば修正する。

機能追加時に必ずやること

エージェントに:「この機能を追加して。ただし既存機能が壊れてはいけない。」

AIの「完了しました」を信じるな

527個の関数のテストを指示したら40個だけやって「完了しました」と報告した。7.6%。画面で自分で確認せよ。

今すぐできる4つ

  1. AIの「完了」を鵜呑みにしない。画面で自分で確認
  2. 重要な決定は要件.mdに記録
  3. 機能追加後、既存機能も手動で確認
  4. 対話が長くなりすぎたら新セッション開始、コンテキストファイルを更新

第3講でこの手動確認を機械に自動でさせる方法を学ぶ。


なぜこう指示すべきなのか

4つの原因

原因1:ロジックドリフト — AIが既存コードをこっそり変更。「前は動いていたのに動かない」

原因2:コンテキスト消失 — 前の決定が次のセッションに伝わらない。「なぜ違う作り方をした?」

原因3:決定と実装の混在 — AIがビジネスルールをコードの詳細と混同。「決めたルールが変わっている」

原因4:おべっか偏向 — AIが完了を虚偽宣言。フロンティアモデルの平均屈服率58%。「確か?」と一言で正しい答えを翻す率:GPT-4 42%、Claude 1.3 98%。

掛け算の数学

97%の精度を5回チェイニングすると85.9%。10回で73.7%。100回で4.8%。小さいプロジェクトではチェイニング回数が少なく確率が持ちこたえるが、大きいプロジェクトでは掛け算が破滅的に作用する。

盲点:再試行しても解決しない

同じ質問を同じ方法で聞くと同じ場所を同じ方法で見落とす。具体的事実を与えて初めて100%に到達。

意見を与えればおべっかし、事実を与えれば修正する。


関連記事

Reins Engineering 全講義

タイトル
第1講AIへの指示の仕方
第2講AIを信じない方法
第3講壊れないアプリ
第4講決定をコードの外へ
第5講手綱のあるAI
第6講通過したら固定する
第7講おべっかを逆手に
第8講エージェントの工場
第9講コードを超えた自動化
第10講データの法

根拠資料

  • Carnegie Mellon MSR 2026 — AIツール導入後コード複雑度41%永久増加、2ヶ月後速度優位消失
  • METR 2025 — 熟練開発者16名、AI使用時19%遅延(体感は20%高速化)
  • Google DORA — AI導入25%増加ごとにソフトウェア配信安定性7.2%低下
  • Amazon 2025-2026 — 21,000 AIエージェント配備後90日間Sev-1事故4件
  • SycEval (AAAI 2025) — フロンティアモデルおべっか屈服率平均58%