ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】在文本分类任务中,针对卷积神经网络(Convolutional Neural Network,CNN)只能提取局部信息,不能更好地表达上下文信息,在提取文本特征时会出现特征丢失的问题。本文提出了一种基于卷积神经网络和长短时记忆网络 (Long Short-Term Memory,LSTM)的混合模型,使得两者优点相结合,利用 CNN可以通过卷积操作获取数据的局部特征,LSTM 可以有效地提取文本的上下文依赖关系,最后使用 Softmax 分类器进行分类。在清华大学自然语言处理研究室提供的中文文本分析资料集上的测试表明,混合模型的准确率可以达到 96.2%。