ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2023 > 7期 > 信息:技术与应用
文本内容识别技术的研究与实践
李惠仪,肖雪丽,廖常辉

【摘要】随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。 旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。 为此,首先,概述了过往的文本内容识别和感知中的相关技术。 其次,介绍了电子档案管理应用中所面临的表格内容电子化还原识别难题。 然后提出了基于 U2-Net 深度学习模型的表格格式提取技术,并通过融合 CRNN 的文字识别技术,实现了端到端的纸质表格内容的全流程解析。 最后,强调了文本内容纸质档案中表格内容电子化技术的重要性,并对后续档案管理工作进行了分析和展望。


【关键字】档案管理;深度学习;文本内容定位;文本识别;表格内容识别