Agentic Search実運用パターン 2026: RAGだけでは足りない場面の設計
いま起きている変化
RAGは依然として有効ですが、実業務では「複数条件をまたぐ問い合わせ」「段階的な検証が必要な質問」が増えています。こうしたケースでは、取得した文書を一度読むだけの構成だと、もっともらしいが不完全な回答になりやすいです。
そこで注目されるのがAgentic Searchです。要点は、検索 + 計画 + ツール検証を一連で回すことにあります。
RAGと対立させない
RAGを捨てる必要はありません。むしろルーティングが重要です。
- 単純な事実確認: RAG
- 複数ステップ推論: Agentic Search
- 実行操作を伴う要求: 承認付きエージェントフロー
技術思想で選ぶのでなく、問い合わせ複雑度で選ぶ設計が現実的です。
実装の基本パターン
- 意図分類(どのモードで答えるか決定)
- プランナー(問いを分解)
- リトリーバ(内部/外部情報を取得)
- ツール層(API・計算・規約照合で裏取り)
- 合成(回答生成と不確実性明示)
- 検証(矛盾・根拠整合チェック)
特に6を省くと、断定的な誤答を量産します。
メモリ設計は階層化する
文脈を増やせば賢くなるわけではありません。過剰文脈は遅延とドリフトを招きます。
- セッション短期メモリ
- タスク限定ワーキングメモリ
- 所有者と期限を持つ長期メモリ
古い情報を無差別に再利用しないことが精度維持の鍵です。
評価は本番指標で行う
- サンプル監査での事実整合率
- 引用整合率
- 未解決問い合わせ率
- ツール呼び出し成功率
- 人手エスカレーション率
ベンチマークのスコアだけでは運用品質を保証できません。
ガバナンス最小要件
- タスク別ツール許可リスト
- 自律ステップ上限
- 高影響回答の人手チェックポイント
- プランとツール呼び出しの完全トレース
追跡可能性がないAgentic Searchは、障害時の復旧が遅れます。
コスト/遅延制御
- 低価値クエリは計画深度を制限
- 中間検索結果をキャッシュ
- 信頼度しきい値で早期終了
- 高負荷時は簡易回答へフォールバック
よいシステムは落ちるのではなく、段階的に性能を下げて継続します。
導入手順
まずは、手作業検証コストが高い1領域(例: 社内規程Q&A)で試験導入。失敗分類を蓄積してから対象領域を広げるのが安全です。
まとめ
Agentic SearchはRAGの代替ではなく拡張です。ルーティング、検証、ガバナンスを一体で設計できれば、回答品質を上げながら運用制御を失わずに済みます。