ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】对于聚类而言确定聚类数目一直是一个具有挑战性的难题。 尽管在经典与深度聚类中,非参数方法的好处是众所周知 的,但大多数方法都是参数的,即需要预定义的固定数量的聚类,用 k 表示。 一旦给定的 k 不准确,那么聚类结果的准确度将会十分 低下,尤其是对于高维数据和多种类数据而言。 本文提出了一种非参数深度自聚类方法———基于蒙特卡洛方法(Monte Carlo method) 的聚类数目确定方法。 它是一种可以对多种类数据自动判断聚类数目的方法,并且得到的嵌入具有很好的解释性,可以用于其他任 务。 本模型采用自编码器作为主体,使用蒙特卡洛方法综合确定聚类数目。 在对多种类数据进行的试验中,效果相对于本文选取的 先进对照方法有了明显的提升。