#ai#rag#search#documentation#platform-engineering
AIドキュメントアシスタント設計: VFS方式とRAG方式を運用で比較する
ドキュメント向けAIアシスタントを本番運用するとき、よく議論になるのが「RAG中心でいくか、VFS(仮想ファイルシステム)中心でいくか」です。これは思想の違いではなく、障害対応・監査対応・保守工数に直結する設計選択です。
方式ごとの得意領域
RAG中心
強み:
- 意味検索で広い文書群を横断しやすい
- 曖昧質問への初動が強い
- 異種データ統合に向く
弱み:
- 埋め込み・インデックス劣化が見えにくい
- チャンク戦略で品質が大きく揺れる
- 再インデックス運用が重くなりやすい
VFS中心
強み:
- どの文書を参照したか再現しやすい
- 正本(canonical)管理と相性が良い
- 権限制御の境界を明確にしやすい
弱み:
- 情報設計が弱いと探索性が落ちる
- 初見の曖昧質問に弱い
- メタデータ整備が前提になる
判断軸
- 回答再現性の要求レベル
- 文書更新頻度と移動頻度
- 検索曖昧性の許容度
- コンプライアンス制約
- 保守体制(誰がどこまで持つか)
実務で有効なハイブリッド
多くの組織では次の構成が安定します。
- 意味検索で候補を絞る
- 最終参照はVFS上の正本に限定
- 回答には参照ファイル境界を保持
これで探索性と監査性のバランスを取りやすくなります。
失敗パターン
- 削除済み文書を指す孤立インデックス
- 取得時権限と表示時権限の不一致
- キャッシュで旧版手順を返す
- 競合版を無理に合成して誤回答
競合が見つかったら、推定回答より「差分提示+エスカレーション」を優先する方が事故を減らせます。
追うべきSLO
- 引用正確率
- 旧版参照率
- 未解決クエリエスカレーション率
- 文書更新から反映までの時間
- ポリシー違反応答件数
まとめ
RAGかVFSかを二択で決めるより、「発見性と統制の両立」を設計目標に置く方が成功率は高いです。実運用では、意味検索で入口を作り、最終根拠を正本ファイルに寄せるハイブリッド構成が、品質・説明責任・保守性のバランスを取りやすい選択です。