ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】本文针对大数据的降维与分类问题,研究了基于主成分分析(principal component analysis,PCA)和K 均值(K⁃means)聚类的处理与分析方法,深入探讨了PCA 与K⁃means 的基本原理,提出了一种结合PCA 降维与K⁃means 聚类的迭代反馈策略,使得降维方向能够通过自适应调整来得到更符合聚类结构的低维表示;以20 Newsgroups 数据集为基础,通过实验证明了该方法的有效性。本研究结果为大规模数据的处理提供了新的思路,对相关领域的应用具有重要的参考价值。