CodeQL Models-as-Data実装戦略：検出結果を「運用できる予防策」に変える

コードスキャン運用が止まる典型は、検出は増えるのに現場が捌けず、やがて信頼を失うことです。GitHub CodeQLでsanitizer/validatorをmodels-as-dataとして宣言できるようになったことで、組織固有の実装文脈を宣言的に反映しやすくなりました。

何が変わるのか

従来、誤検知低減のためにはQuery自体を拡張する必要があり、保守負荷が高いのが課題でした。models-as-dataは、検出ロジックの本体を壊さず、文脈調整をデータ拡張で管理できる点が大きいです。

これにより、社内共通関数やフレームワーク特有の安全化処理を自然にモデル化できます。

責任者を層ごとに固定すると、モデル肥大化を防げます。

モデル変更は「設定」ではなく「セキュリティコード変更」です。

この型がないと、静かに検知穴が広がります。

本番適用前に最低限必要なのは以下です。

精度（precision）と再現率（recall）の推移を継続可視化します。

三者連携の仕組みを持つ組織は改善速度が速いです。

「検出件数」ではなく「安全運用のスループット」を見るのがポイントです。

対策として、期限付き運用と四半期棚卸しを標準化します。

90日後には「どの変更が検知品質をどう変えたか」を説明できる状態が目標です。

models-as-dataは、セキュリティ知識を属人化から資産化へ移すための実装手段です。統制付きで運用すれば、誤検知疲れを減らしながら予防的なコードスキャン体制を強化できます。