ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2024 > 3期 > 记录:数据与存储
一种基于深度学习的档案文件齐全性检验方法
肖雪丽,廖常辉,李惠仪

【摘要】本文针对档案管理领域中的档案文件齐全性检验任务,提出了一种基于深度学习的解决方法,旨在提高检验效率。 首 先,利用深度学习中的双向长短时记忆网络-条件随机场模型( bidirectional long short⁃term memory⁃conditional random field, BiLSTM⁃ CRF)对档案文件名进行文本分词,以精准提取出关键词。 其次,构建关键词库,并结合预设规则,形成了一种灵活且高效的档案文件 齐全性检验策略。 再次,通过采用句子级双向编码器的 Transformer 表示模型( sentence bidirectional encoder representations from transformers, SBERT),计算文本之间的相似度,进行精确的档案文件比对,以便及时发现文件是否存在缺失、重复或超出预期的情况。 最后,对档案文件的齐全性进行快速、准确的评估,为档案管理人员提供有力的决策支持。 

【关键字】 档案文件齐全性;深度学习;文本匹配;文本分词