ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合 BERT、TEXTRCNN、BILSTM-CRF 的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用 BERT 词嵌入技术高效获得句子语义特征,利用 TEXTRCNN双向递归的结构以及 BILSTM-CRF 模型的运用来解决序列标注问题,综合考虑上下文捕捉、词嵌入、文本特征等因素,提高对新闻识别的准确性。实验证明,使用该融合模型对新闻文本分类的准确率达到 0.9551,且具有较好的泛化能力,能够更好地帮助有关部门及时处理突发舆情和失控事件。