信息记录材料

首页 > 刊期 > 2025 > 5期 > 信息：理论与观点

基于源代码扩展信息的语句级软件缺陷定位方法

李鑫鹏

【摘要】在现有语句级软件缺陷定位过程中，单纯从语句本身很难捕捉到代码背后的语义和设计意图等深层次上下文信息，并借此来准确判断其是否为缺陷语句，使得在定位缺陷时容易出现误判或漏判。为此，本研究提出基于源代码扩展信息的语句级软件缺陷定位方法。首先，构建历史缺陷报告库，采用余弦相似度从中检索相似语句级软件缺陷报告；其次，在门控循环单元（ｇａｔｅｄｒｅｃｕｒｒｅｎｔｕｎｉｔ，ＧＲＵ）的基础上融合硬注意力算法，对提取的历史语句级软件缺陷源代码隐性信息进行扩展，提取源代码隐性特征。最后，综合考量元素相似度和结构相似度，度量源代码与报告库中历史缺陷相似度，定位可疑程度最大的软件缺陷，实现基于源代码扩展信息的语句级软件缺陷定位。实验表明：设计方法平均倒数排名（ｍｅａｎｒｅｃｉｐｒｏｃａｌｒａｎｋ，ＭＲＲ）在０. ６以上，平均准确率（ｍｅａｎａｖｅｒａｇｅｐｒｅｃｉｓｉｏｎ，ＭＡＰ）为９２.４２％，可以实现语句级软件缺陷精准定位。

【关键字】源代码扩展信息；语句级；软件缺陷；定位；门控循环单元；硬注意力算法

【PDF】