ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】伴有复杂参数空间的目标检测神经网络模型很难直接部署在计算资源受限的设备上,模型量化的方法能有效对模型进行压缩,但是量化降低模型大小的同时会带有频繁的量化计算开销以及模型精度的下降。针对这一问题,本文先提出一种将浮点数模型量化为定点数模型的优化量化算法,并以一阶段和二阶段经典检测网络 Faster RCNN 和YOLOv3 作为原始模型,在 PASCAL VOC2012 数据集进行模型训练得到 baseline 模型,然后对 baseline 模型做 clip 与量化。实验结果表明,量化后的模型与浮点数模型相比检测精度下降了 0.5% ~ 2%,模型大小压缩了近 75%。