ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】深度学习已成为当前计算机研究领域不可或缺的重要方法,不仅适用于分类任务,还能学习聚类友好的特征表示以提高数据聚类性能。 然而,现有深度聚类算法受传统聚类算法的框架约束,难以获得最优聚类结果。 同时,无监督深度聚类易受低质量伪标签影响,导致聚类效果不佳。 本文提出一种新的自适应半监督深度聚类(ASeDC)方法,该方法充分利用少量标记数据,在大量未标记数据中自适应地从高置信度数据中提取信息,以促进半监督聚类。 在手写数字识别(MNIST)数据集和 Fashion⁃MNIST 数据集上的对比实验表明,ASeDC 方法在准确性和各种聚类评估指标(Calinski⁃Harabaz 指数、轮廓系数和 Davies⁃Bouldin 指数)方面均优于主流聚类算法[传统 K 均值(K-means)聚类算法、约束种子 K-means 聚类算法和无监督深度聚类算法]。