ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2025 > 11期 > 信息:理论与观点
借助自然语言处理模型的档案文献自动标引与分类研究
林龙江

【摘要】针对档案管理智能化水平提升的需求,本研究探索了自然语言处理技术在档案文献处理中的应用。 通过引入词向量模型和主题模型等技术,构建了包含数据预处理、特征提取与关键词选择、主题词映射与规范化模块的自动标引模型,以及由文本表示层、特征融合层、分类决策层组成的自动分类模型,并基于多领域档案文献数据开展实验。 结果表明:自动标引模型准确率达 85%、召回率为 80%、F1 值为 82.5%;自动分类模型准确率达 90%、召回率为 88%、F1 值为 89%,性能优于部分经典对比模型。 综上所述,自然语言处理技术可有效提升档案文献处理的智能化水平,在档案管理领域具有显著的应用价值。

【关键字】自然语言处理模型;档案文献;自动标引分类
【PDF】