上場子会社の FP&A で「月次決算 → 付議資料 → 経営会議」のリードタイムを 2 週間 → D+1 に圧縮。鍵は 「AI が書く工程」と「人間が判断する工程」の明確な線引き。データ取得・連結・差異分析・コメンタリー初稿は AI、重要度評価・経営示唆・次アクション設計は人間。初稿の文体・粒度を学習させたプロンプト設計と、レビュアー向けのチェック観点一覧がセット。
なぜ FP&A は遅いのか
FP&A プロセスのリードタイムを 2 週間 → D+1 に圧縮する実装パターン。鍵は「AI が書く工程」と「人間が判断する工程」の明確な線引き。データ取得・連結・差異分析・コメンタリー初稿は AI、重要度評価・経営示唆・次アクション設計は人間。Claude + MCP + Google Apps Script の組み合わせで実現。
事業会社の経営企画にいたとき、もっとも違和感があったのは**「月次決算を締めてから、経営会議資料ができるまで 2 週間」** という構造でした。
実際の工程を時間軸で分解すると:
- Day 0 (月末): 会計システムで月次締め
- Day 1–3: 子会社・事業部からの個別 PL 集約、連結調整
- Day 4–6: 予実差異の数字確認、異常値の洗い出し
- Day 7–10: 差異要因分析、コメンタリー (文章) 執筆
- Day 11–13: 上司レビュー → 書き直し → 上位レビュー
- Day 14: 経営会議付議
問題は Day 1–10 の大部分が定型データ処理 だということ。「会計数字を取って → 前年比・予算比を計算して → 文章で説明する」という作業は、人間が書いても AI が書いても結論は同じです。なのに Day 14 までには経営判断の鮮度が失われている。
再設計 — 「書く」と「判断する」を分離する
従来の FP&A プロセスは 「書く作業」と「判断する作業」が混在 していました。経営企画パーソンが 1 人で数字の取得・集計・差異分析・文章化・経営示唆まで全部やる。これは AI エージェントで根本から変えられます。
定型処理を AI に完全委譲し、人間は 「判断」 だけに集中する
従来 10 日かかっていた工程を、AI が D+1 で初稿を出す → 人間が D+2 でレビューと判断のみ に再配分。
定型処理 (AI 担当):
- 会計システムからのデータ取得 (MCP 経由)
- 予算マスタ・前年数値との突合
- 差異の事実記述 (数値の羅列レベル)
- 一次コメンタリー初稿 (定型フォーマットに沿った数字の言語化)
- 過去月と同じ論点での継続的なモニタリング
判断処理 (人間担当):
- 差異要因の重要度評価 (どの数字を経営に持ち上げるか)
- 経営への示唆の言語化 (So What の抽出)
- 次月の注目論点の設定
- 経営会議への論点化・議題設計
この境界線が引けると、工程の半分以上が自動化できます。
実装 — Claude + MCP + Google Apps Script の組み合わせ
データ取得層 (MCP)
- freee MCP で会計 PL / BS を日次取得
- Google Sheets MCP で予算マスタ・過去実績・事業部別 KPI を読み込み
- BigQuery MCP で GA4 / 広告データを取得 (事業 KPI の実績データ)
MCP 経由で一元化することで、「どこから取ってきたデータか」が常にトレーサブル。
連結・差異分析層 (Python + GAS)
単純な数字の突き合わせは Python スクリプトで実行。Sheets 上のフォーマットへの書き出しは Google Apps Script。両者の境界は「計算 → Python / 表示 → GAS」。
実装のポイント:
- 予算マスタの正本は Sheets 1 枚 にする (分散させると差分管理が破綻する)
- 差異計算は Sheets 上の数式ではなく Python で実行し、結果を Sheets に書き出す (監査可能性)
- 予実対比は
(実績 - 予算) / 予算ではなく 絶対額 + 率を並列 (経営層に読みやすい)
コメンタリー生成層 (Claude)
一番効くのがここ。Claude に以下を与えて初稿生成:
- 過去 6 ヶ月分の経営会議コメント (文体学習)
- 今月の差異データ (構造化された数値と要因)
- プロンプト (フォーマット・禁止事項・重要度フラグ)
プロンプトの核:
あなたは上場子会社の経営企画として、経営会議に対して月次実績を説明します。
以下のルールを厳守してください:
1. 「So What」を必ず示す。事実記述だけで終わらない。
2. 推測と事実を分離する ("〜の可能性がある" と "確認済み" を書き分け)。
3. 「致命的」「大きく悪化」などの感情語を使わない。具体的な数値で記述する。
4. 通期影響・単月影響を分離する。
5. 金額を分解する (例: 固定費増 ¥X 百万、変動費増 ¥Y 百万)。
このプロンプトが .claude/rules/board-comments.md として運用中 (mixednuts 内部資産)。
失敗事例 — 2026-04 のドラマ化インシデント
途中で大きな失敗もありました。2026-04-07 の広告 (EC クライアント) の定期レビューで、Claude が「17 倍の乖離が発生!計測が壊れている可能性!」と警告してきたのですが、実害を計算すると ¥3 だった という事例。
原因: Claude の「役立ちたい」バイアスが暴走して、異常値を見た瞬間にドラマを構築してしまう。計算と解釈を分離せず、解釈から入ってしまった。
対策として .claude/rules/calibration.md を追加し、以下を強制:
- 異常値を見たら 先に金額/件数で実害を計算する まで警告を出さない
- 「致命的」「破滅的」「壊れている」は使用禁止。代替は「実害 ¥X、優先度 P0」
- 仮説には 信頼度 (高/中/低) + 複数のデータソース裏付け を付与
この Calibration ルールが走るようになってから、FP&A の月次コメンタリーも「盛らない」トーンに安定しました。CFO / 経営会議にとって、月次 FP&A の資料で一番読みにくいのは 「書き手が盛っているか抑えているか」の判断コスト なので、ここが安定するだけで読む側の負荷が激減する。
成果
- リードタイム: 14 日 → 2 日 (D+1 初稿 + D+2 レビュー判断)
- 経営企画チームの時間配分: 集計作業 80% / 判断 20% → 集計 20% / 判断・論点設計 80%
- 経営会議での議論: 「数字確認」から「判断と次アクション」中心に移行
展開先 — 他の FP&A プロセスへ
この設計は月次決算以外にも応用できます:
週次予実モニタリング
D+1 初稿生成を週次でも回すことで、毎週の経営会議で「今週の異常値 + 月内着地予想」が手元に届く構造。AI が毎朝データを取得し、閾値を超えた項目だけ通知 → 人間が判断。
四半期の予算修正
Bottom-up の事業部別 Forecast 集約を AI で自動化。人間は「レバー感度分析」「経営判断」だけに集中。
投資評価 (DCF / IRR)
投資評価モデルのシナリオ感応度は定型計算。AI に「Bull / Base / Bear × 感度変数 3 軸」を回させて、人間はパートナー評価・契約条件評価に集中。
FAQ
Q. 会計データを AI に渡すとセキュリティ的に大丈夫か? A. Claude の Enterprise 契約 (学習データに利用されないプラン) を使えばデータは安全。それでも機密性が高い場合は、数値を変換 (対数化・ハッシュ化) して渡す、または Azure OpenAI / Vertex AI の "中で閉じる" プランを使う選択肢あり。
Q. どの会計システムなら MCP 連携しやすいか? A. API が素直なのは freee / 弥生クラウド / マネーフォワード。大企業の SAP / Oracle は個別実装コストがかかるが、FP&A 用の Data Mart を BigQuery / Snowflake に集約して、そこから MCP 経由で AI が読む構成が現実的。
Q. GAS と Python のどちらをメインにすべきか? A. 「Sheets に書き出す / Sheets から読み込む」作業は GAS、それ以外の計算・外部 API 呼び出しは Python。GAS は認証と Sheets API の設定がラクだが、重い計算と pip ライブラリ活用は Python が圧倒的。
Q. Calibration ルールは Claude の temperature 設定と何が違う? A. temperature は出力のランダム性の調整、Calibration ルールは 「情報の誇張度・主張の強さ」の調整。両方必要。FP&A 用途では temperature 0.2-0.4、Calibration ルールをシステムプロンプトに明記。
Q. このパターンを個人事業主レベルで使うには? A. freee MCP + Claude Desktop で月次 PL を取得 → 「前月と比較した要因分析」を依頼、という最小構成で始められます。個人事業主なら「粗利率の変化・営業 CF の動き・特定費目の急増」だけ自動で指摘してもらうだけでも、仕訳の質が上がる。
参考文献 / Sources
会計システム API:
- freee API[1] リファレンス — OAuth 2.0, refresh token 90日サイクル
- マネーフォワード クラウド API
- Google Apps Script[2] リファレンス
Claude / MCP 関連:
- Anthropic Claude Enterprise — 学習データ非利用プラン
- Model Context Protocol[3] (MCP) — MCP 仕様
- Building agents with MCP (Anthropic)
mixednuts 内部ルール (公開運用ドキュメント):
.claude/rules/board-comments.md— 経営会議コメント 8 ヶ条.claude/rules/calibration.md— ドラマ化禁止ルール