ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对传统的随机森林算法(R F)在对聚类效率欠佳导致训练精度不高的缺陷,本文提出了一种基于特征聚类的随机森林算法(KM-FCM-RF),首先用传统 RF 方法对初始数据集聚类后,然后使用 K 均值聚类(KM)和模糊 C -均值(FCM)结合根据样本相似度划分族群,得到最终的高维特征序列。将 KM-FCM-RF 算法应用于特征数据集 KddCup99 和Minst,并与传统的 RF 比较,实验结果表明,KM-FCM-RF 算法具有更好的聚类效果、提高了预测精度,具备良好的可行性。