ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对档案管理智能化水平提升的需求,本研究探索了自然语言处理技术在档案文献处理中的应用。 通过引入词向量模型和主题模型等技术,构建了包含数据预处理、特征提取与关键词选择、主题词映射与规范化模块的自动标引模型,以及由文本表示层、特征融合层、分类决策层组成的自动分类模型,并基于多领域档案文献数据开展实验。 结果表明:自动标引模型准确率达 85%、召回率为 80%、F1 值为 82.5%;自动分类模型准确率达 90%、召回率为 88%、F1 值为 89%,性能优于部分经典对比模型。 综上所述,自然语言处理技术可有效提升档案文献处理的智能化水平,在档案管理领域具有显著的应用价值。