ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2024 > 3期 > 信息:技术与应用
互联网非结构化数据预处理策略研究
季 婷,罗卫萍

【摘要】互联网中蕴含着大量多源、异构的非结构化数据,它们是互联网情报分析的主要信息来源。 然而由于非结构化数据自身 的特点,目前对这些数据的处理和分析仍面临诸多现实困难。 本文分别从互联网非结构化数据的采集、集成和存储 3 个方面提出对 应策略,以提升互联网非结构化数据的预处理效能,旨在为后续数据处理分析奠定良好的基础。 

【关键字】非结构化数据;数据预处理;互联网信息