一种基于粒球的多视图对比聚类方法
2025-02-25 14:41
No.1343956210705244160
技术概要
PDF全文
本技术公开了一种基于粒球的多视图对比聚类方法,包括以下步骤:步骤1:获取多视图数据,形成数据集;步骤2:构建多视图对比聚类模型,多视图对比聚类模型包括数据处理模块,粒球生成模块和输出模块;步骤3:对多视图对比聚类模型进行训练,得到训练后多视图对比聚类模型;步骤4:根据训练后多视图对比聚类模型得到所需聚类结果;本发明方法将样本集分割为粗粒度的粒球,在视图内和跨视图粒球之间建立关联;这些关联在共享的潜在空间中得到加强,从而实现多粒度对比学习,粒球位于实例级别和簇级别之间,保留了样本集的局部拓扑结构。
背景技术
多视图数据收集自不同的传感器或者特征提取器,通常表现出异质性。例如,网页中包含有图片、文本、视频等,它们被视为不同的视图,从各自的角度反应了一部分网页的信息。多视图聚类近年来受到持续的关注,旨在以无监督的范式将多视图数据聚为多个簇。其关键挑战在于怎样平衡多视图的一致性和互补性,从而学得最全面的共识表示。传统的多视图聚类方法主要分为三类:子空间学习、图学习和多核学习。这些方法涉及矩阵的分解和融合,具有较高的计算复杂度,因而难以应用在大规模数据集上,这限制了它们的实际应用。 近年来基于深度学习的多视图聚类方法因其卓越的特征表示能力而受到广泛关注。此类方法拓展了深度单视图聚类方法,对于不同视图会根据视图特性选择特定的特征提取器。如,Deep canonical correlation analysis提出的方法使用深度神经网络将两个视图的数据投影到公共空间中,其中两个视图的特征表示高度相关,使其成为典型相关分析的非线性扩展。Deep subspace clustering with sparsity prior提出的方法是一种具有稀疏先验的深度子空间聚类方法,它将输入数据投影到潜在空间中,通过最小化重建损失来保持局部结构,同时将稀疏先验信息引入潜在表示学习中以保留整个数据集的稀疏重建关系。Duet Robust Deep Subspace Clustering使用两个正则化规范从数据重建和潜在自我表达的角度对崩溃模式(例如视图内噪声)进行建模,还提出了不可微范数的平滑方法,以使用基于梯度的方法优化损失函数。DIMC-net:Deep Incomplete Multi-viewClustering Network通过特定于视图的自动编码器提取多个视图的高级特征,并引入基于融合图的约束来保留数据的局部几何结构。Deep multi-view spectral clustering viaensemble应用集成聚类来融合来自不同视图的相似性图,使用图自动编码器来学习公共谱嵌入。它设计了一个统一的优化框架,同时最小化图重建损失、正交性损失和图对比损失。这些方法通过将传统方法(例如邻域图约束和自表达约束)的约束引入深度模块投影的潜在空间,将深度学习与传统的多视图学习思想相结合。这允许模型学习简洁而全面的表示,最大限度地保留输入数据的结构信息。 现有的多视图对比学习方法通常在两个尺度上运行:实例级和簇级。实例级方法基于样本对应关系构建正负对,旨在将正对更接近,并将负对进一步推开在潜在空间中。聚类级方法侧重于计算每个视图下样本的聚类分配,并通过减少分布差异来最大化视图共识,例如最小化KL散度或最大化互信息。然而,这两种类型的方法要么引入假负对,导致模型可辨别性降低,要么忽略局部结构,并且不能明确地测量跨视图簇之间的关系。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
黄树东  苏鹏  蔡和城  刘洋  冯文韬  刘权辉  曹智文
技术所属: 四川大学
相关技术
一种服务开发方法、装置、设备及存储介质 一种服务开发方法、装置、设备及存储介质
一种高精度双层优化方法的神经网络搜索架构构建方法 一种高精度双层优化方法的神经网络搜索架构构建方法
跨总线域的设备对宿主机空间DMA访问方法及相关设备 跨总线域的设备对宿主机空间DMA访问方法及相关设备
一种客户信息定期维护方法及系统 一种客户信息定期维护方法及系统
代码发布方法、装置、计算机设备和可读存储介质 代码发布方法、装置、计算机设备和可读存储介质
一种基于统一管理平台的子应用数据获取方法及装置 一种基于统一管理平台的子应用数据获取方法及装置
利用深度学习的BIM模型错误自动检测系统 利用深度学习的BIM模型错误自动检测系统
一种基于智能反射面的室内T型走廊场景路径损耗的分析方法 一种基于智能反射面的室内T型走廊场景路径损耗的分析方法
模型评估任务处理方法及装置 模型评估任务处理方法及装置
基于大数据的异常信号智能识别方法 基于大数据的异常信号智能识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利