FP&A 月次締めが 2 週間 → D+1 に短縮するまで — AI エージェント × 管理会計の実装パターン | Insights

Q: GAS と Python のどちらをメインにすべきか？

「Sheets に書き出す / Sheets から読み込む」作業は GAS、**それ以外の計算・外部 API 呼び出しは Python**。GAS は認証と Sheets API の設定がラクだが、重い計算と pip ライブラリ活用は Python が圧倒的。

Q: Calibration ルールは Claude の temperature 設定と何が違う？

temperature は出力のランダム性の調整、Calibration ルールは **「情報の誇張度・主張の強さ」の調整**。両方必要。FP&A 用途では temperature 0.2-0.4、Calibration ルールをシステムプロンプトに明記。

TL;DR

上場子会社の FP&A で「月次決算 → 付議資料 → 経営会議」のリードタイムを 2 週間 → D+1 に圧縮。鍵は 「AI が書く工程」と「人間が判断する工程」の明確な線引き。データ取得・連結・差異分析・コメンタリー初稿は AI、重要度評価・経営示唆・次アクション設計は人間。初稿の文体・粒度を学習させたプロンプト設計と、レビュアー向けのチェック観点一覧がセット。

D+1

月次締めから経営会議資料初稿生成まで (従来 14 日)

Source · mixednuts 実装実績

なぜ FP&A は遅いのか

結論

FP&A プロセスのリードタイムを 2 週間 → D+1 に圧縮する実装パターン。鍵は「AI が書く工程」と「人間が判断する工程」の明確な線引き。データ取得・連結・差異分析・コメンタリー初稿は AI、重要度評価・経営示唆・次アクション設計は人間。Claude + MCP + Google Apps Script の組み合わせで実現。

事業会社の経営企画にいたとき、もっとも違和感があったのは**「月次決算を締めてから、経営会議資料ができるまで 2 週間」** という構造でした。

実際の工程を時間軸で分解すると:

Day 0 (月末): 会計システムで月次締め
Day 1–3: 子会社・事業部からの個別 PL 集約、連結調整
Day 4–6: 予実差異の数字確認、異常値の洗い出し
Day 7–10: 差異要因分析、コメンタリー (文章) 執筆
Day 11–13: 上司レビュー → 書き直し → 上位レビュー
Day 14: 経営会議付議

問題は Day 1–10 の大部分が定型データ処理 だということ。「会計数字を取って → 前年比・予算比を計算して → 文章で説明する」という作業は、人間が書いても AI が書いても結論は同じです。なのに Day 14 までには経営判断の鮮度が失われている。

再設計 — 「書く」と「判断する」を分離する

従来の FP&A プロセスは 「書く作業」と「判断する作業」が混在 していました。経営企画パーソンが 1 人で数字の取得・集計・差異分析・文章化・経営示唆まで全部やる。これは AI エージェントで根本から変えられます。

PRINCIPLE 01

定型処理を AI に完全委譲し、人間は「判断」だけに集中する

従来 10 日かかっていた工程を、AI が D+1 で初稿を出す → 人間が D+2 でレビューと判断のみ に再配分。

定型処理 (AI 担当):

会計システムからのデータ取得 (MCP 経由)
予算マスタ・前年数値との突合
差異の事実記述 (数値の羅列レベル)
一次コメンタリー初稿 (定型フォーマットに沿った数字の言語化)
過去月と同じ論点での継続的なモニタリング

判断処理 (人間担当):

差異要因の重要度評価 (どの数字を経営に持ち上げるか)
経営への示唆の言語化 (So What の抽出)
次月の注目論点の設定
経営会議への論点化・議題設計

この境界線が引けると、工程の半分以上が自動化できます。

実装 — Claude + MCP + Google Apps Script の組み合わせ

データ取得層 (MCP)

freee MCP で会計 PL / BS を日次取得
Google Sheets MCP で予算マスタ・過去実績・事業部別 KPI を読み込み
BigQuery MCP で GA4 / 広告データを取得 (事業 KPI の実績データ)

MCP 経由で一元化することで、「どこから取ってきたデータか」が常にトレーサブル。

連結・差異分析層 (Python + GAS)

単純な数字の突き合わせは Python スクリプトで実行。Sheets 上のフォーマットへの書き出しは Google Apps Script。両者の境界は「計算 → Python / 表示 → GAS」。

実装のポイント:

予算マスタの正本は Sheets 1 枚 にする (分散させると差分管理が破綻する)
差異計算は Sheets 上の数式ではなく Python で実行し、結果を Sheets に書き出す (監査可能性)
予実対比は (実績 - 予算) / 予算 ではなく 絶対額 + 率を並列 (経営層に読みやすい)

コメンタリー生成層 (Claude)

一番効くのがここ。Claude に以下を与えて初稿生成:

過去 6 ヶ月分の経営会議コメント (文体学習)
今月の差異データ (構造化された数値と要因)
プロンプト (フォーマット・禁止事項・重要度フラグ)

プロンプトの核:

あなたは上場子会社の経営企画として、経営会議に対して月次実績を説明します。
以下のルールを厳守してください:

1. 「So What」を必ず示す。事実記述だけで終わらない。
2. 推測と事実を分離する ("〜の可能性がある" と "確認済み" を書き分け)。
3. 「致命的」「大きく悪化」などの感情語を使わない。具体的な数値で記述する。
4. 通期影響・単月影響を分離する。
5. 金額を分解する (例: 固定費増 ¥X 百万、変動費増 ¥Y 百万)。

このプロンプトが .claude/rules/board-comments.md として運用中 (mixednuts 内部資産)。

失敗事例 — 2026-04 のドラマ化インシデント

途中で大きな失敗もありました。2026-04-07 の広告 (EC クライアント) の定期レビューで、Claude が「17 倍の乖離が発生！計測が壊れている可能性！」と警告してきたのですが、実害を計算すると ¥3 だった という事例。

原因: Claude の「役立ちたい」バイアスが暴走して、異常値を見た瞬間にドラマを構築してしまう。計算と解釈を分離せず、解釈から入ってしまった。

対策として .claude/rules/calibration.md を追加し、以下を強制:

異常値を見たら 先に金額/件数で実害を計算する まで警告を出さない
「致命的」「破滅的」「壊れている」は使用禁止。代替は「実害 ¥X、優先度 P0」
仮説には 信頼度 (高/中/低) + 複数のデータソース裏付け を付与

この Calibration ルールが走るようになってから、FP&A の月次コメンタリーも「盛らない」トーンに安定しました。CFO / 経営会議にとって、月次 FP&A の資料で一番読みにくいのは 「書き手が盛っているか抑えているか」の判断コスト なので、ここが安定するだけで読む側の負荷が激減する。

成果

リードタイム: 14 日 → 2 日 (D+1 初稿 + D+2 レビュー判断)
経営企画チームの時間配分: 集計作業 80% / 判断 20% → 集計 20% / 判断・論点設計 80%
経営会議での議論: 「数字確認」から「判断と次アクション」中心に移行

展開先 — 他の FP&A プロセスへ

この設計は月次決算以外にも応用できます:

PRINCIPLE 02

週次予実モニタリング

D+1 初稿生成を週次でも回すことで、毎週の経営会議で「今週の異常値 + 月内着地予想」が手元に届く構造。AI が毎朝データを取得し、閾値を超えた項目だけ通知 → 人間が判断。

PRINCIPLE 03

四半期の予算修正

Bottom-up の事業部別 Forecast 集約を AI で自動化。人間は「レバー感度分析」「経営判断」だけに集中。

PRINCIPLE 04

投資評価 (DCF / IRR)

投資評価モデルのシナリオ感応度は定型計算。AI に「Bull / Base / Bear × 感度変数 3 軸」を回させて、人間はパートナー評価・契約条件評価に集中。

FAQ

Q. 会計データを AI に渡すとセキュリティ的に大丈夫か？ A. Claude の Enterprise 契約 (学習データに利用されないプラン) を使えばデータは安全。それでも機密性が高い場合は、数値を変換 (対数化・ハッシュ化) して渡す、または Azure OpenAI / Vertex AI の "中で閉じる" プランを使う選択肢あり。

Q. どの会計システムなら MCP 連携しやすいか？ A. API が素直なのは freee / 弥生クラウド / マネーフォワード。大企業の SAP / Oracle は個別実装コストがかかるが、FP&A 用の Data Mart を BigQuery / Snowflake に集約して、そこから MCP 経由で AI が読む構成が現実的。

Q. GAS と Python のどちらをメインにすべきか？ A. 「Sheets に書き出す / Sheets から読み込む」作業は GAS、それ以外の計算・外部 API 呼び出しは Python。GAS は認証と Sheets API の設定がラクだが、重い計算と pip ライブラリ活用は Python が圧倒的。

Q. Calibration ルールは Claude の temperature 設定と何が違う？ A. temperature は出力のランダム性の調整、Calibration ルールは 「情報の誇張度・主張の強さ」の調整。両方必要。FP&A 用途では temperature 0.2-0.4、Calibration ルールをシステムプロンプトに明記。

Q. このパターンを個人事業主レベルで使うには？ A. freee MCP + Claude Desktop で月次 PL を取得 → 「前月と比較した要因分析」を依頼、という最小構成で始められます。個人事業主なら「粗利率の変化・営業 CF の動き・特定費目の急増」だけ自動で指摘してもらうだけでも、仕訳の質が上がる。

参考文献 / Sources

会計システム API:

freee API ^[1] リファレンス — OAuth 2.0, refresh token 90日サイクル
マネーフォワードクラウド API
Google Apps Script ^[2] リファレンス

Claude / MCP 関連:

Anthropic Claude Enterprise — 学習データ非利用プラン
Model Context Protocol ^[3] (MCP) — MCP 仕様
Building agents with MCP (Anthropic)

mixednuts 内部ルール (公開運用ドキュメント):

.claude/rules/board-comments.md — 経営会議コメント 8 ヶ条
.claude/rules/calibration.md — ドラマ化禁止ルール

#FP&A #AI #管理会計 #月次締め #経営会議 #Claude #GAS

AI-first 組織の構築にご関心ありませんか?

私たちの知見をあなたの事業に実装します。60分の無料相談をご予約ください。

無料相談を申し込む →

FP&A 月次締めが 2 週間 → D+1 に短縮するまで — AI エージェント × 管理会計の実装パターン

定型処理を AI に完全委譲し、人間は 「判断」 だけに集中する

週次予実モニタリング

四半期の予算修正

投資評価 (DCF / IRR)

AI-first 組織の構築にご関心ありませんか?

関連記事

定型処理を AI に完全委譲し、人間は「判断」だけに集中する