ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】互联网中蕴含着大量多源、异构的非结构化数据,它们是互联网情报分析的主要信息来源。 然而由于非结构化数据自身 的特点,目前对这些数据的处理和分析仍面临诸多现实困难。 本文分别从互联网非结构化数据的采集、集成和存储 3 个方面提出对 应策略,以提升互联网非结构化数据的预处理效能,旨在为后续数据处理分析奠定良好的基础。