ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】云计算的产生为大规模数据处理提供了良好支持,而要获取其中有用的数据信息还需要借助数据挖掘算法。 基于此,本文从云计算视域出发,探究了 Hadoop 分布式系统结构,分析了现有 K⁃means 数据挖掘算法工作过程与存在的主要不足,并提出了优化的 K⁃means 数据挖掘算法。 通过实验对比结果表明,优化后的算法在处理各个数据簇样本时,不管是数据收集覆盖率,还是数据中心点确定准确率都更好。 同时,优化的 K⁃means 数据挖掘算法在不正确数据数量上要更低。 由此证明,优化的 K⁃means 数据挖掘算法具有良好的应用效果。