ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2025 > 2期 > 记录:数据与存储
基于PCA 和K⁃means 的大规模数据降维与聚类分析
陈春茹

【摘要】本文针对大数据的降维与分类问题,研究了基于主成分分析(principal component analysis,PCA)和K 均值(K⁃means)聚类的处理与分析方法,深入探讨了PCA 与K⁃means 的基本原理,提出了一种结合PCA 降维与K⁃means 聚类的迭代反馈策略,使得降维方向能够通过自适应调整来得到更符合聚类结构的低维表示;以20 Newsgroups 数据集为基础,通过实验证明了该方法的有效性。本研究结果为大规模数据的处理提供了新的思路,对相关领域的应用具有重要的参考价值。

【关键字】大数据;数据降维;聚类分析;K⁃means
【PDF】