ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2024 > 6期 > 记录:云端与互联
云计算中基于BERT模型的文本分析与处理
白佳璐

【摘要】本研究针对云计算环境中文本处理的需求,提出了一种基于双向编码器表示转换器( bidirectional encoder representationfrom transformers,BERT)的并行化方法。 首先,介绍了BERT模型的基本原理以及编码器组成的 Transformer 结构,并对文本进行标记化和上下文建模的机制;其次,本研究关注文本在云计算环境下的处理效率,提出了一种并行化的BERT模型优化策略,并通过对文本进行预处理、分割和标记化,实现了对 BERT 模型的并行计算,以提高在大规模文本数据上的计算效率;最后,为验证所提出方法的有效性,本文选用了CoNLL2003 数据集进行实验。 实验结果表明,相较于串行模型,并行BERT模型在准确率、召回率和F1值上均有显著提升,其优于串行模型的原因包括计算效率提升、全局上下文建模、资源利用率提高和更强泛化能力等方面。

【关键字】BERT模型;文本分析;并行;云计算