ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】在现有语句级软件缺陷定位过程中,单纯从语句本身很难捕捉到代码背后的语义和设计意图等深层次上下文信息,并借此来准确判断其是否为缺陷语句,使得在定位缺陷时容易出现误判或漏判。 为此,本研究提出基于源代码扩展信息的语句级软件缺陷定位方法。 首先,构建历史缺陷报告库,采用余弦相似度从中检索相似语句级软件缺陷报告;其次,在门控循环单元( gated recurrentunit,GRU)的基础上融合硬注意力算法,对提取的历史语句级软件缺陷源代码隐性信息进行扩展,提取源代码隐性特征。 最后,综合考量元素相似度和结构相似度,度量源代码与报告库中历史缺陷相似度,定位可疑程度最大的软件缺陷,实现基于源代码扩展信息的语句级软件缺陷定位。 实验表明:设计方法平均倒数排名( mean reciprocal rank,MRR) 在 0. 6 以上,平均准确率( mean averageprecision,MAP)为 92.42%,可以实现语句级软件缺陷精准定位。