信息记录材料

首页 > 刊期 > 2025 > 4期 > 信息：理论与观点

基于Ｔｒａｎｓｆｏｒｍｅｒ⁃ＬＳＴＭ架构的语音去噪方法研究

胡必波，刘红英，王传传，甄雅迪

【摘要】在语音识别系统中，语音信号与噪声的叠加使得传统方法难以有效进行语音识别。针对这一问题，本研究提出一种基于Ｔｒａｎｓｆｏｒｍｅｒ的长短期记忆（ｌｏｎｇｓｈｏｒｔ⁃ｔｅｒｍｍｅｍｏｒｙ，ＬＳＴＭ）架构的语音去噪方法，该方法结合Ｔｒａｎｓｆｏｒｍｅｒ的多头注意力机制和ＬＳＴＭ的时序建模能力，能够有效地从混合语音信号中去除背景噪声；语音去噪模型采用自适应学习率进行训练优化，基于ＷＳＪ０－Ｍｉｘ数据集的评估结果表明：基于Ｔｒａｎｓｆｏｒｍｅｒ⁃ＬＳＴＭ架构的语音去噪方法在信噪比、信号失真比和感知语音质量评估等指标上均优于传统的梯度下降方法，表明Ｔｒａｎｓｆｏｒｍｅｒ⁃ＬＳＴＭ架构能够在语音去噪任务中提供更为精确的信号恢复和噪声抑制能力，也充分验证了该方法在语音去噪任务中的有效性和优越性。

【关键字】Ｔｒａｎｓｆｏｒｍｅｒ；长短期记忆（ＬＳＴＭ）；多头注意力机制；语音去噪；自适应学习率

【PDF】