信息记录材料

首页 > 刊期 > 2026 > 2期 > 综合：探索与发现

ＡＩ安全检测模型的可解释性与归因分析

朱晓娅

【摘要】人工智能（ＡＩ）安全检测模型已成为网络安全防御的核心手段，但其“黑箱特性”导致决策过程难以追溯，且现有可解释性方法存在场景适应性差、因果关系不明确、实际落地困难等问题，难以满足合规要求。本文梳理了ＡＩ安全检测模型的可解释性需求与挑战，提出一种融合因果推理与安全知识图谱的归因框架，通过“特征级－路径级－因果级”三级流程实现精准溯源，并在典型场景中开展真实案例验证。结果显示，该框架的解释结果与人工分析的一致性达到９２％，安全事件处置时间缩短５０％以上。定量评估表明，本框架的解释保真度显著优于传统的沙普利可加性解释（ＳＨＡＰ）方法，能够为ＡＩ安全工具提供“可解释、可信赖、可落地”的技术支撑。

【关键字】人工智能（ＡＩ）安全检测；可解释性；归因分析；因果推理

【PDF】