ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】为了有效提高非结构化数据处理的效率,本研究围绕 MapReduce 框架、Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)、Hadoop 数据库(Hadoop Database,HBase)技术展开了深入研究,并在此基础上设计并实现了一个非结构化数据处理系统,针对系统的小文件存储性能优化和 HBase 数据存储优化提出了相应的解决方案,极大地改善了非结构化数据的处理效率,为相关领域研究提供了一定的参考价值。