信息记录材料

首页 > 刊期 > 2024 > 1期 > 信息：理论与观点

云计算视域下数据挖掘算法探讨

杨小龙

【摘要】云计算的产生为大规模数据处理提供了良好支持，而要获取其中有用的数据信息还需要借助数据挖掘算法。基于此，本文从云计算视域出发，探究了Ｈａｄｏｏｐ分布式系统结构，分析了现有Ｋ⁃ｍｅａｎｓ数据挖掘算法工作过程与存在的主要不足，并提出了优化的Ｋ⁃ｍｅａｎｓ数据挖掘算法。通过实验对比结果表明，优化后的算法在处理各个数据簇样本时，不管是数据收集覆盖率，还是数据中心点确定准确率都更好。同时，优化的Ｋ⁃ｍｅａｎｓ数据挖掘算法在不正确数据数量上要更低。由此证明，优化的Ｋ⁃ｍｅａｎｓ数据挖掘算法具有良好的应用效果。

【关键字】云计算；数据挖掘算法；Ｋ⁃ｍｅａｎｓ