信息记录材料

首页 > 刊期 > 2025 > 11期 > 信息：理论与观点

基于自适应半监督深度聚类的方法研究

武福林，朱飑凯（通信作者）

【摘要】深度学习已成为当前计算机研究领域不可或缺的重要方法，不仅适用于分类任务，还能学习聚类友好的特征表示以提高数据聚类性能。然而，现有深度聚类算法受传统聚类算法的框架约束，难以获得最优聚类结果。同时，无监督深度聚类易受低质量伪标签影响，导致聚类效果不佳。本文提出一种新的自适应半监督深度聚类（ＡＳｅＤＣ）方法，该方法充分利用少量标记数据，在大量未标记数据中自适应地从高置信度数据中提取信息，以促进半监督聚类。在手写数字识别（ＭＮＩＳＴ）数据集和Ｆａｓｈｉｏｎ⁃ＭＮＩＳＴ数据集上的对比实验表明，ＡＳｅＤＣ方法在准确性和各种聚类评估指标（Ｃａｌｉｎｓｋｉ⁃Ｈａｒａｂａｚ指数、轮廓系数和Ｄａｖｉｅｓ⁃Ｂｏｕｌｄｉｎ指数）方面均优于主流聚类算法［传统Ｋ均值（Ｋ－ｍｅａｎｓ）聚类算法、约束种子Ｋ－ｍｅａｎｓ聚类算法和无监督深度聚类算法］。

【关键字】深度学习；自适应半监督学习；深度聚类；高置信度

【PDF】