ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2022 > 6期 >
结合 BERT 词嵌入和双向循环卷积神经网络的新闻文本 分类研究
任 鹏,李文杰,舒宇杰,孙 航,赵旖旎

【摘要】针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合 BERT、TEXTRCNN、BILSTM-CRF 的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用 BERT 词嵌入技术高效获得句子语义特征,利用 TEXTRCNN双向递归的结构以及 BILSTM-CRF 模型的运用来解决序列标注问题,综合考虑上下文捕捉、词嵌入、文本特征等因素,提高对新闻识别的准确性。实验证明,使用该融合模型对新闻文本分类的准确率达到 0.9551,且具有较好的泛化能力,能够更好地帮助有关部门及时处理突发舆情和失控事件。

【关键字】BERT;中文新闻;文本分类;TEXTRCNN;BILSTM-CRF