基于VHMM 的语音特征提取与情感状态分析
李 倩
【摘要】针对语音情感识别问题,本文提出了一种基于可变长度隐马尔可夫模型(VHMM)的优化方法。 首先,对语音信号进行预处理和特征提取,得到特征向量序列;其次,结合隐马尔可夫模型(HMM)数学原理,引入显式持续时间分布建模策略,实现对语音情感状态持续时间的自适应刻画;最后,通过总体识别率、精确率、召回率及 F1 分数等指标,对比了传统 HMM 与本文方法的识别性能。结果表明,本文方法在各项评价指标上均显著优于传统 HMM。
【关键字】情感识别;隐马尔可夫模型;可变长度优化;梅尔频率倒谱系数
【PDF】