ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】为了更加准确地对驾驶员的人脸进行定位并进行驾驶状态分析,本文提出一种基于改进 YOLOv5 及 ConvNeXt 的级联分 类算法。 算法首先采用引入注意力机制的 YOLOv5 作为人脸定位器,然后将定位裁剪后的图片输入到 ConvNeXt 的卷积神经网络中 进行分类。 引入的卷积注意力机制 YOLOv5 网络不仅增强了网络对复杂背景中目标区域的感知能力,同时减少了网络参数量和计算 复杂度,与此同时,采用 3:3:9:3 的卷积模块数量比例的 ConvNeXt 增强了网络对特征的提取能力,并且与 Swin Transformer 相比拥有 更快的推理速度以及更高的准确率。 最终,在实验评估中该模型在 FER2013 数据集上可达到 73???? 65%的准确率,在 KMU⁃FED 数据集 上达到了 97???? 73%的准确率,较好地实现了驾驶员的人脸表情识别及状态分析。