Codexプラグイン連携時代の統制設計: 20超SaaSを扱う実務ガバナンス

Codex系のコーディング支援が、メール、ドライブ、リポジトリ、デザイン、ドキュメント、チャット、クラウド運用系まで一気に接続可能になったことで、AI活用の本質が変わりました。いま価値を決めるのは「モデル単体の賢さ」よりも「どのツールに、どの権限で、どの条件で触れられるか」です。

つまり、これは生産性機能の追加ではなく、分散実行基盤の導入です。導入成功の鍵は、UI上のON/OFFではなく、制御プレーンの設計にあります。

なぜプラグイン拡張はリスク構造を変えるのか

従来のAIアシスタントは、提案までで止まるケースが中心でした。しかしツール連携が進むと、次の3境界が一気に曖昧になります。

データ境界: チケット、Wiki、チャット、ソースコードの文脈が単一セッションに集約される
実行境界: 文章での提案が、実際のAPI呼び出しとして副作用を持つ
責任境界: 人間操作・ボット操作・自動化ワークフローの区別が監査上見えにくくなる

この状態で「とりあえず接続して様子を見る」をやると、あとで必ず監査不能になります。

先に作るべきは“ツール権限ティア”

連携設定の前に、アクションを3階層に分けます。

Read-only: 検索・参照・要約など副作用のない取得
Draft: コメント案、PR本文案、ドキュメント草案など人間最終確認前提
Execute: マージ、権限変更、デプロイ、課金設定変更など状態変更

ティアごとに承認要件、ログ粒度、ロールバック手順を固定化しておくと、運用の再現性が上がります。

ID設計は「Botアカウント1個」では足りない

実務で最も事故るのはIDの粒度不足です。最低でも以下の3者を1イベントで紐づけます。

起点ユーザー（誰の依頼か）
アシスタント実行主体（どのランタイムか）
実際の操作主体（どの外部サービスIDで実行したか）

この3つを不可変ログで一体管理しないと、インシデント時に「誰の責任か」が曖昧になります。

タスク契約で文脈スコープを制限する

「必要なら何でも検索可能」は禁止です。各タスクで契約を持たせます。

目的（何を達成するか）
参照許可ドメイン（どのデータに触れてよいか）
禁止対象（法務、財務、経営層チャンネルなど）
実行上限（時間、再試行回数、並列数）

この契約があると、ポリシー違反の説明責任を機械的に果たせます。

Prompt→Tool間の決定論ゲート

モデル出力をそのまま実行しないことが大前提です。実行前に必ず次を挟みます。

スキーマ検証（厳格な関数引数チェック）
ポリシーLint（禁止スコープの静的検査）
リスク判定（閲覧/編集/権限昇格）
条件付き承認分岐（中〜高リスクの人間承認）

これにより、「自然言語としてもっともらしいが危険」な出力を自動実行から外せます。

観測可能性の最低ライン

本番運用で最低限必要なテレメトリは次です。

セッション単位のツール呼び出しグラフ
引数のハッシュ化記録とマスキング状態
ポリシー判定ログ（許可/拒否/例外）
外部副作用の証跡（Issue番号、Commit SHA、Deploy ID）

チャットログだけ保存して安心するのは危険です。必要なのは会話履歴ではなく「実行履歴」です。

FinOps: トークン単価だけでは管理不能

ツール連携では隠れコストが増えます。

API再試行の増幅
連携先ごとの待ち行列肥大化
低信頼アクションの人間レビュー工数

対策として、オーケストレーション層で以下を設計します。

チーム別ツールコール予算
連携別同時実行上限
負荷時の自動降格（Execute→Draft）

これで「止めずに守る」運用が可能になります。

段階導入の現実解

導入は4段階で進めると失敗しにくいです。

第1段階: Read-only + シャドーログ
第2段階: Draft中心 + 人間承認
第3段階: Sandboxで限定自動実行
第4段階: 本番実行 + 例外承認運用

各段階の通過条件は感覚ではなく、誤実行率、巻き戻し時間、違反密度などの数値で固定します。

組織責任を先に分離する

責任分界点を先に明文化してください。

Security: ポリシー体系と例外管理
Platform: 実行基盤の信頼性と監査性
各開発チーム: タスク契約と業務妥当性
監査部門: 定期的なコントロール検証

これが曖昧だと、問題発生時に「AIが勝手にやった」で終わります。

今四半期にやるべき実行項目

接続済みSaaSと権限の棚卸し
Read/Draft/Executeの3ティア分類
Execute全経路への実行前ゲート実装
連携ごとのロールバック手順書整備
監査スキーマの横断統一

まとめ

Codexプラグイン連携の本質は、DX強化ではなく「企業システム全体にまたがる実行面の再設計」です。ID、ポリシー、観測可能性を先に整えたチームは、安全に生産性を拡大できます。逆に、接続だけ先行すると、見えない運用負債が急速に積み上がります。