ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对传统信息数据资源库在处理智能化、个性化需求方面的局限性,本文提出一种基于机器学习的信息数据资源库设计方案。该方案通过数据统一采集接入、数据清洗处理、数据组织管理及数据分析挖掘4 个核心模块,构建自动化、可扩展的数据处理架构。结果表明,该资源库在数据接入、清洗、索引构建和查询性能方面均优于主流开源系统,特别是在高并发和大数据场景下表现突出。