一种基于动态降维加权图学习的不完整多视图聚类方法技术

技术编号:38583310 阅读:12 留言:0更新日期:2023-08-26 23:27
本发明专利技术公开了一种基于动态降维加权图学习的不完整多视图聚类方法,包括:S11.输入原始数据矩阵;S12.通过动态降维加权图学习的方式计算每个视图的相似度矩阵;S13.在融合阶段自动加权,添加非负矩阵约束,动态学习共识矩阵;S14.将动态降维加权图学习和共识矩阵学习整合成一个框架,得到目标函数;S15.通过交替迭代算法对得到的目标函数进行求解,直接得到聚类结果。本发明专利技术在学习相似矩阵阶段,通过动态降维加权图学习的方式,噪声和冗余被有效地过滤,并且减弱不完整数据对聚类结果造成的影响。在自加权图融合过程中,通过添加非负正交约束,提高共识矩阵的质量,并且可以直接获得最终的聚类结果。因而可以更精准的得到聚类结果。果。果。

【技术实现步骤摘要】
一种基于动态降维加权图学习的不完整多视图聚类方法


[0001]本专利技术属于无监督聚类
,涉及一种多视图聚类方法,尤其涉及一种基于动态降维加权图学习的不完整多视图聚类方法。

技术介绍

[0002]多视图聚类是机器学习领域的研究热点问题,并被广泛应用于对象分割、药物治疗研究、显著性检测等领域。其目的是通过跨多个视图利用互补和一致的信息来提高聚类性能,大多数多视图聚类方法的研究都假定可以从每个视图中完全观察到数据,关注如何利用互补信息和减少多个特征视图之间的冗余来帮助数据聚类。然而,这一假设在实际应用中可能并不成立,在一些实际应用中,由于数据采集器的临时故障或人为错误,经常遇到样本之间缺少部分视图,从而形成不完整的多视图数据。例如,在新闻报道中,由于环境的复杂性,可能无法获得清晰的音频和视频,在这种情况下,每个视图可能具有不同数量的实例,这将给传统的多视图聚类方法带来巨大的挑战,因此有必要开发不完整多视图聚类(IMVC)算法来处理视图特征不完整的多视图数据。
[0003]近年来,针对不完整多视图聚类,人们做了很多努力,矩阵分解将数据矩阵分解为两个低秩矩阵的乘积,实现了数据的降维,由于该方法具有较好的可解释性和明确的物理意义,近年来提出了许多基于矩阵分解的方法,如部分多视图聚类(PVC)、不完整多模态聚类(IMG)和部分多视图子空间聚类(PMSC),然而,这些方法并不灵活,因为处理两个以上的不完整视图较为困难,此外,由于基于图的方法在传统的多视图聚类任务中取得了巨大的成功,近年来也为不完整多视图聚类提出了许多图学习模型,该方法可以有效地利用数据的几何结构并且很好地利用不完整特征视图的样本之间的内在关系。
[0004]虽然先前的多视图聚类算法从各方面提升了聚类性能,但是仍有许多问题亟需解决,第一,对于原始数据的噪音和冗余问题很多方法并没有有效解决;第二,缺失视图中隐含的隐藏信息没有被充分利用来辅助样本关系学习;第三,许多方法忽略了不同视图重要性的差异,没有从不完整视图中学习共识图的自适应图;第四,许多方法需要额外的聚类算法来生成最终的聚类。
[0005]为了解决上述问题,本专利技术提出了一种基于动态降维加权图学习的不完整多视图聚类(ARDGL)方法。

技术实现思路

[0006]本专利技术的目的是针对现有技术的缺陷,提供了一种基于动态降维加权图学习的不完整多视图聚类方法。
[0007]为了实现以上目的,本专利技术采用以下技术方案:
[0008]一种基于动态降维加权图学习的不完整多视图聚类方法,包括:
[0009]S1.输入原始数据矩阵;
[0010]S2.通过动态降维加权图学习的方式计算每个视图的相似度矩阵;
[0011]S3.在融合阶段自动加权,添加非负矩阵约束,动态学习共识矩阵;
[0012]S4.将动态降维加权图学习和共识矩阵学习整合成一个框架,得到目标函数;
[0013]S5.通过交替迭代算法对得到的目标函数进行求解,直接得到聚类结果。
[0014]进一步的,所述步骤S2中通过动态降维加权图学习的方式计算每个视图的相似度矩阵,表示为:
[0015][0016]其中,V表示视图个数;s
i(v)
和s
ij(v)
分别表示第v个视图的相似度矩阵中第i行的向量和第i行第j列的元素;x
i(v)
和x
j(v)
分别表示第v个视图数据矩阵中第i行的向量以及第j行的向量;|| ||2表示向量的第二范式;N表示完整的数据实例个数;N
v
表示实际观测的实例个数;表示第v个视图的转换矩阵,为低维子空间的维数;期望生成不相关的低维特征空间,且有;I表示单位矩阵;p
v,i
表示第v个视图中第i个实例的权重,记为:
[0017][0018]其中h
v,i
表示指示矩阵第v行j列,定义如下:
[0019]。
[0020]进一步的,所述步骤S3中在融合阶段自动加权,添加非负矩阵约束,动态学习共识矩阵,表示为:
[0021][0022]其中,b
i
是统一图矩阵B的列向量;b
ij
是b
i
的第j列元素;|| ||
F
表示矩阵的F范数;λ为权衡参数;正交矩阵Z的每一列表示一个基本向量;Y是用于直接产生最终聚类结果的非负矩阵;w
v
为第v个视图的权重,定义为。
[0023]进一步的,所述步骤S4中将动态降维加权图学习和共识矩阵学习整合成一个框架,得到目标函数,表示为:
[0024]。
[0025]进一步的,所述步骤S5具体为:S51.固定G
(v)
、B、Y、Z,优化S
(v)
,在该子问题中,S
(v)
有两种情况,分别是初始化阶段
的相似度矩阵和迭代优化阶段的相似度矩阵,对于初始化阶段的相似度矩阵来说,丢弃其它无关项,则目标函数表示为:
[0026][0027]对于迭代优化阶段的相似度矩阵来说,丢弃其它无关项,则目标函数表示为:
[0028];
[0029]S52.固定S
(v)
、B、Y、Z,优化G
(v)
,丢弃其它无关项,则目标函数表示为:
[0030];S53.固定S
(v)
、G
(v)
、Y、Z,优化B,丢弃其它无关项,则目标函数表示为:
[0031];
[0032]S54.固定S
(v)
、G
(v)
、B、Z,优化Y,丢弃其它无关项,则目标函数表示为:
[0033];
[0034]S55.固定S
(v)
、G
(v)
、B、Y,优化Z,丢弃其它无关项,则目标函数表示为:
[0035]。
[0036]与现有技术相比,本专利技术通过动态降维加权图学习的方式,有效过滤了原始数据的噪声和冗余,并且减弱不完整数据对聚类结果造成的影响,在自加权图融合过程中,通过添加非负正交约束,提高共识矩阵的质量,并且无需后处理步骤,即可获得最终的聚类结果。
附图说明
[0037]在附图中:
[0038]图1是实施例一提供的一种基于动态降维加权图学习的不完整多视图聚类方法流程图;
[0039]图2是是实施例一提供的ARDGL方法的算法框图。
具体实施方式
[0040]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效,本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变,需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0041]本专利技术针对现有缺陷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态降维加权图学习的不完整多视图聚类方法,其特征在于,包括:S1.输入原始数据矩阵;S2.通过动态降维加权图学习的方式计算每个视图的相似度矩阵;S3.在融合阶段自动加权,添加非负矩阵约束,动态学习共识矩阵;S4.将动态降维加权图学习和共识矩阵学习整合成一个框架,得到目标函数;S5.通过交替迭代算法对得到的目标函数进行求解,直接得到聚类结果。2.根据权利要求1所述的一种基于动态降维加权图学习的不完整多视图聚类方法,其特征在于,所述步骤S2中通过动态降维加权图学习的方式计算每个视图的相似度矩阵,表示为:,其中,V表示视图个数;s
i(v)
和s
ij(v)
分别表示第v个视图的相似度矩阵中第i行的向量和第i行第j列的元素;x
i(v)
和x
j(v)
分别表示第v个视图数据矩阵中第i行的向量以及第j行的向量;|| ||2表示向量的第二范式;N表示完整的数据实例个数;N
v
表示实际观测的实例个数;表示第v个视图的转换矩阵,为低维子空间的维数;期望生成不相关的低维特征空间,且有;I表示单位矩阵;p
v,i
表示第v个视图中第i个实例的权重,记为:,其中h
v,i
表示指示矩阵第v行j列,定义如下:。3.根据权利要求2所述的一种基于动态降维加权图学习的不完整多视图聚类方法,其特征在于,所述步骤S3中在融合阶段自动加权,添加非负矩阵约束,动态学习共识矩阵,表示为:,其中,b
i
是统一图矩阵B的列向量;b
ij
是b
...

【专利技术属性】
技术研发人员:于耀淞孙冬璞
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1