Claude Code Review で1日150万円。
AI に push まで任せた事故の全貌と、5つの対策
Anthropic 公式の Claude Code Review(GitHub PR 自動レビュー機能・従量課金)が暴走し、ある組織で1日で約150万円($10,000+)のコストが発生した事故が報告された。当事者である田中さん(supateam.com 運営)が事故の構造と再発防止策を生々しく公開している。
一言で言うと、「Claude Code Review → AI エージェントが対応 → push → また Claude Code Review」の無限ループが Stacked PR と組み合わさり、業務終了後も AI 同士が議論し続けて課金が積み上がった。返金リクエスト中。
まず混同しがちな2つを整理
同じ「Claude Code」という名前でも、別サービス。今回の事故は 後者 で発生した。
| サービス | 動く場所 | 課金方式 | 今回の事故 |
|---|---|---|---|
| Claude Code(CLI 版) | ターミナル・ローカル | Pro / Max サブスク定額 | 関係なし |
| Claude Code Review | GitHub の PR 上(GitHub Action 系) | 従量課金($25.81 / レビュー) | こちらで発生 |
何が起きたのか(無限ループの構造)
原因は単一ではなく、複数の設定とフローが噛み合った結果のループだった。
Claude Code Review が走る
GitHub の PR に対し、push のたびに自動レビューがトリガーされる設定だった。1レビュー約 $25.81。
AI がレビュー対応を判断 → 修正 → push
ローカルの AI エージェント(Codex / Claude 等)に、レビューコメントの対応要否判断と修正・push まで任せていた。
push のたびに再レビュー
2 の push が再び 1 の Claude Code Review をトリガー。コメント追加 → AI 対応 → push を繰り返す。
Stacked PR で N 倍に増幅
上流 PR を修正すると後続 PR にも rebase / force push が波及。1 PR で済むレビューが N 個の PR に拡散。
結果、業務終了後も AI 同士が「指摘 → 修正 → 再指摘」のループを止めず、一晩で $10,000 超 に到達。クレカ決済ログを Slack に流していたチームメンバーが気付いて止めた。
とりあえずこれをやっておけ(5つの対策)
当事者発・最優先の5項目
- Claude Team の組織月間利用上限設定(最後の砦。Enterprise なら月次以外にも細かく設定可能)
- Claude Code Review の per-service limitを設定(特定サービスでの暴走を阻止)
- Claude Code Review のトリガーを「push ごと」→「1回」に変更(最重要・最も効果あり)
- クレカ決済ログを Slack 等に流して常時監視(今回はこれで気づいた)
- ガードレールとハーネスの運用を徹底(ルール整備+自動監視)
上限・per-service limit・トリガー変更はすべて claude.ai/admin-settings/usage から設定可能(Team / Enterprise プラン)。
4つの反省点(当事者発)
push ごとレビューを軽視
「便利だから」で push トリガーのまま運用。変更のたびにフルレビューが走るリスクを過小評価していた。
Stacked PR との相性を見誤った
Stacked PR は PR 分割に有効だが、上流修正で後続全てに rebase が波及。1レビューが N レビューに化ける構造に気付かなかった。
AI に判断・push まで任せた
「コメント整理 → 対応判断 → 修正 → push → 監視」を AI に丸投げ。最終判断は人間が下すべきだった。
組織上限を最後の砦に
$10,000 の上限は「最後の砦としては高すぎた」。もっと手前で止まるガードレール(per-service / 日次 / 通知)が必要。
名言(当事者の言葉)
ローカルの AI エージェントはサブスクで使っていたため、今この瞬間に API コストが増えているという感覚が薄かったです。一方で、GitHub 側で動いている Claude Code Review は Anthropic の組織利用量を消費していました。
ローカルの体感コストと、実際に課金されているコストにズレがある状況で、従量課金の AI が長時間実行される状態を作り出してしまいました。
今まではAIをとにかく使わせるフェーズだったので各種エージェント比較的安価での提供でしたが、もう良さを知った僕らからしっかりビジネスとしてお金をとってくるフェーズになると思います。
スクール生・受講生への教訓
この事故は「他人事」ではない。AI エージェントを業務に組み込むなら、誰もが通る検討事項。
持ち帰るべき4つの原則
- サブスクと従量課金は別の感覚で扱う。月額に慣れると従量の体感が鈍る
- AI に「判断 → push」までフルオートで任せない。最終判断は人間。Codex CLI `/codex-review` のように手動 approve まで止まる設計が安全
- 業務終了時に AI を必ず止める。「動かしっぱなし」が一晩で破産を生む
- コストガードレールは複層化(組織上限・サービス上限・日次通知・決済ログ監視)
普段使っているのは Claude Code(CLI 版・サブスク定額)なので、この事故の直接被害は受けない。ただし「AI に push 権限を渡す」運用は将来必ず候補に上がる。今のうちに「最終判断は人間」「ガードレール複層化」の原則を頭に入れておく価値あり。
結びの一言
AI を使った開発の利便性を取りすぎると、安全性とコスト面のガードレールが疎かになる。「サブスクの体感」と「従量の実費」のズレが今回の事故の本質。AI に push まで任せる前に、必ず「人間が最終承認する設計」と「複層のコスト上限」を仕込んでおく。150万円という痛みを、自分の組織で繰り返さないために。