本技术公开了一种基于粒球的多视图对比聚类方法,包括以下步骤:步骤1:获取多视图数据,形成数据集;步骤2:构建多视图对比聚类模型,多视图对比聚类模型包括数据处理模块,粒球生成模块和输出模块;步骤3:对多视图对比聚类模型进行训练,得到训练后多视图对比聚类模型;步骤4:根据训练后多视图对比聚类模型得到所需聚类结果;本发明方法将样本集分割为粗粒度的粒球,在视图内和跨视图粒球之间建立关联;这些关联在共享的潜在空间中得到加强,从而实现多粒度对比学习,粒球位于实例级别和簇级别之间,保留了样本集的局部拓扑结构。
背景技术
多视图数据收集自不同的传感器或者特征提取器,通常表现出异质性。例如,网页中包含有图片、文本、视频等,它们被视为不同的视图,从各自的角度反应了一部分网页的信息。多视图聚类近年来受到持续的关注,旨在以无监督的范式将多视图数据聚为多个簇。其关键挑战在于怎样平衡多视图的一致性和互补性,从而学得最全面的共识表示。传统的多视图聚类方法主要分为三类:子空间学习、图学习和多核学习。这些方法涉及矩阵的分解和融合,具有较高的计算复杂度,因而难以应用在大规模数据集上,这限制了它们的实际应用。
近年来基于深度学习的多视图聚类方法因其卓越的特征表示能力而受到广泛关注。此类方法拓展了深度单视图聚类方法,对于不同视图会根据视图特性选择特定的特征提取器。如,Deep canonical correlation analysis提出的方法使用深度神经网络将两个视图的数据投影到公共空间中,其中两个视图的特征表示高度相关,使其成为典型相关分析的非线性扩展。Deep subspace clustering with sparsity prior提出的方法是一种具有稀疏先验的深度子空间聚类方法,它将输入数据投影到潜在空间中,通过最小化重建损失来保持局部结构,同时将稀疏先验信息引入潜在表示学习中以保留整个数据集的稀疏重建关系。Duet Robust Deep Subspace Clustering使用两个正则化规范从数据重建和潜在自我表达的角度对崩溃模式(例如视图内噪声)进行建模,还提出了不可微范数的平滑方法,以使用基于梯度的方法优化损失函数。DIMC-net:Deep Incomplete Multi-viewClustering Network通过特定于视图的自动编码器提取多个视图的高级特征,并引入基于融合图的约束来保留数据的局部几何结构。Deep multi-view spectral clustering viaensemble应用集成聚类来融合来自不同视图的相似性图,使用图自动编码器来学习公共谱嵌入。它设计了一个统一的优化框架,同时最小化图重建损失、正交性损失和图对比损失。这些方法通过将传统方法(例如邻域图约束和自表达约束)的约束引入深度模块投影的潜在空间,将深度学习与传统的多视图学习思想相结合。这允许模型学习简洁而全面的表示,最大限度地保留输入数据的结构信息。
现有的多视图对比学习方法通常在两个尺度上运行:实例级和簇级。实例级方法基于样本对应关系构建正负对,旨在将正对更接近,并将负对进一步推开在潜在空间中。聚类级方法侧重于计算每个视图下样本的聚类分配,并通过减少分布差异来最大化视图共识,例如最小化KL散度或最大化互信息。然而,这两种类型的方法要么引入假负对,导致模型可辨别性降低,要么忽略局部结构,并且不能明确地测量跨视图簇之间的关系。
实现思路