CurrentStack
#cloud#ai#agents#security#platform-engineering

Cloudflare Dynamic Workers公開βを企業導入する実装指針: AIエージェント実行を安全に分離する

CloudflareのDynamic Workers公開βは、単なる「起動が速い実行環境」ではありません。AIエージェント時代の実務では、実行基盤そのものを統制対象として再設計する必要があり、その有力な選択肢になっています。

参考: https://blog.cloudflare.com/dynamic-workers/

ポイントは速度よりも、計画・統制・実行を分離できることです。ここを分けられるかどうかで、エージェント活用は「便利な実験」で終わるか、「運用可能な基盤」になるかが決まります。

なぜ今Dynamic Workersなのか

多くの組織では、現状のエージェント実行が次のどれかに偏っています。

  • 長寿命コンテナにタスクを押し込む方式
  • モノリスAPI内でツール呼び出しを連鎖させる方式
  • サーバーレス関数を場当たりで増やす方式

この3つは最終的に同じ問題へ収束します。ノイジーネイバー、実行ドリフト、権限境界の曖昧化です。Dynamic Workersは、実行単位を「短命・隔離・観測可能」にそろえやすく、統制設計に向いています。

推奨アーキテクチャ: 4層で責務を分離する

実務で安定する構成は次の4層です。

  1. Intent層: ユーザー要求やジョブ要求を正規化する
  2. Policy層: データ区分・操作範囲・テナント権限を判定する
  3. Execution層: 制約済み能力セットでDynamic Workerを起動する
  4. Evidence層: 判定結果と成果物メタデータを保存する

失敗パターンは、同じ信頼境界で「何をするかの判断」と「実行」を同時に持たせることです。責務分離を先に決めるだけで、後工程の事故率が下がります。

ツール列挙ではなく能力契約で管理する

エージェント運用が崩れる主因は、ツール数の増加そのものではなく、能力境界が言語化されないことです。

おすすめは契約型の分離です。

  • Read-only契約(ログ、ドキュメント、メトリクス参照)
  • Controlled mutation契約(コメント、ラベル、ステージング更新)
  • Privileged契約(本番変更、課金操作)※明示承認必須

契約ごとにDynamic Workerの実行プロファイルを分けると、運用者が「この実行単位が何をしてよいか」を即時に説明できます。

セキュリティ設計: Isolateだけで完結しない

隔離実行は強力ですが、企業運用で必要なのは多層防御です。

  • 期限付き署名タスク(リプレイ耐性)
  • 実行ごとに固定化したポリシースナップショット
  • 宛先/プロトコル単位の外向き通信許可リスト
  • actor -> tenant -> run の決定的ID連結
  • プロンプト/ログ/成果物へのマスキング規約

「自社モデルが生成したコードだから安全」とは見なさないこと。生成コードは常に未検証入力として扱うべきです。

信頼性設計: バーストに耐えるための前提

エージェント基盤は平常時より、障害時や定時バッチ時の急増で壊れます。

  • 対話系リクエストとバッチ系キューを分離
  • テナント別同時実行予算を明示
  • 過負荷時の挙動(拒否/遅延/機能縮退)を先に定義
  • 起動遅延と完了遅延を分離して監視

1つの平均レイテンシだけでは、どこで詰まっているかを見誤ります。

監査可能性: 後付けではなく初期設計で入れる

後から監査ログを足すと、相関できない断片ログが残ります。実行単位ごとに最低限これを保存します。

  • 実行主体とテナント情報
  • 適用ポリシーの版と判定
  • 使用した能力契約
  • コード/成果物の識別子
  • 外向き通信の要約
  • 終了理由(完了/拒否/タイムアウト)

これがあると、障害時に「誰が何をどう通したか」を短時間で再構成できます。

コンテナ型基盤からの移行手順

全面移行は避け、段階化します。

  • Phase 1: 読み取り主体の支援処理
  • Phase 2: 低リスクな書き込み処理(ステージング中心)
  • Phase 3: 本番自動化の限定適用(厳密承認つき)

各Phaseで「中止条件」を先に決めるのが重要です。ロールバック基準なしの導入は、実質的に不可逆なリスク判断になります。

運用KPI: 速度以外を追う

コストやトークン量だけでは基盤品質を測れません。次を継続観測します。

  • チーム別のポリシー拒否率
  • 計画と実行のドリフト率
  • 人手オーバーライド頻度
  • エージェント起因インシデント関連率
  • テナント間の公平性(混雑時)

この指標群は、目立つ障害になる前に統制負債を検出できます。

まとめ

Dynamic Workersは「サーバーレス高速化」の話ではなく、AIエージェントの実行境界を標準化する機会です。ポリシー、証跡、実行分離を先に整えたチームほど、後から速く・安全に拡張できます。

おすすめ記事