ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对档案信息资源普遍存在的分散存储、异构性强及检索效率低下等问题,本研究系统性地探索大数据技术在档案整合与检索中的深度融合与应用。通过构建基于分布式存储与并行计算架构的数据汇聚模型,实现多源、多格式档案资源的高效集成与统一管理;引入自然语言处理技术,结合深度学习算法开展实体识别、语义关联挖掘与主题建模,显著提升跨资源语义检索的准确性与深度;进一步借助用户画像技术,构建个性化的检索推荐机制,使检索过程更具智能化和用户友好性。经真实环境下的案例验证,本研究提出的整合与检索模型在档案查全率、查准率和响应时间等多个关键指标上均表现出显著提升,为海量档案信息的价值挖掘与高效利用提供了坚实的技术支撑和可行的实施路径。