ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】本文研究基于深度学习的复杂场景多尺度目标检测与识别方法,旨在解决传统方法在处理多尺度目标时的挑战。通过构建多尺度特征金字塔、使用不同卷积核和锚框等策略,提高了目标检测的鲁棒性和泛化能力。本文设计了自适应多尺度空间池化(adaptive multi⁃scale spatial pooling, AMSSP)模块网络结构,融合了Darknet-53 深度残差网络、残差空洞卷积及跨局部注意力机制。并详细给出了AMSSP 模块的实现过程和算法步骤,包括不同尺度池化层的输出特征图的融合方式等。本研究旨在通过深度学习提升复杂场景多尺度目标检测与识别的鲁棒性和泛化能力。