ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。 旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。 为此,首先,概述了过往的文本内容识别和感知中的相关技术。 其次,介绍了电子档案管理应用中所面临的表格内容电子化还原识别难题。 然后提出了基于 U2-Net 深度学习模型的表格格式提取技术,并通过融合 CRNN 的文字识别技术,实现了端到端的纸质表格内容的全流程解析。 最后,强调了文本内容纸质档案中表格内容电子化技术的重要性,并对后续档案管理工作进行了分析和展望。