一种基于低秩亲和图学习的二进制多视图聚类方法技术

技术编号:38893603 阅读:38 留言:0更新日期:2023-09-22 14:16
本发明专利技术提供一种基于低秩亲和图学习的二进制多视图聚类方法,包括:获取给定多视图数据;对所述多视图数据进行非线性核映射,从而得到映射数据;将所述映射数据输入低秩优化的子空间聚类模型中,从而获取亲和图;将亲和图输入到二进制哈希算法编码器中,充分获得亲和图之间的互补性与一致性,使得亲和图之间进行相互学习;构建优化目标函数,并对所述目标函数进行求解;利用迭代更新策略,在固定一个变量的同时,交替更新其他变量,直至收敛;最后利用矩阵分解策略,获得指示矩阵,从而得到聚类结果。本发明专利技术通过对数据进行二进制处理,使得处理大规模数据速度大幅提升,并且采用矩阵分解能够一步得出聚类结果,避免了由两步得出结果的误差累积。果的误差累积。果的误差累积。

【技术实现步骤摘要】
一种基于低秩亲和图学习的二进制多视图聚类方法


[0001]本专利技术涉及多视图聚类领域,具体而言,尤其涉及一种基于低秩亲和图学习的二进制多视图聚类方法。

技术介绍

[0002]现有的一些多视图聚类方法,多数是通过原始数据建立亲和图,根据所建立的亲和图输入到谱聚类中得到聚类结果。由于实值数据需要相当高的计算成本才能生成具有大规模多视图数据的图,一些学者就利用二进制代码而不是实值特征的散列方法。此外,还有一些学者提出了二进制聚类方法,采用正则化项来减少构造相似图的失真误差,联合学习模态内相似图,并且通过对称非负矩阵分解重构相似度图,利用二进制码内积学习。
[0003]尽管上述聚类方法虽然取得了一定效果,但由于直接利用原始数据建立图,无法保证学习到的图具有准确的相似度,同时由于忽略了多视图潜在的聚类结构,导致聚类效果欠佳。

技术实现思路

[0004]根据上述提出的现有的二进制多视图聚类方法无法从不同的视图中有效的挖掘出底层的聚类结构的技术问题,而提供一种基于低秩亲和图学习的二进制多视图聚类方法。本专利技术通过对数据进行二进制处本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于低秩亲和图学习的二进制多视图聚类方法,其特征在于,包括以下步骤:获取给定多视图数据;对所述多视图数据进行非线性核映射,抓取数据最底层的相似点结构,从而得到映射数据;将所述映射数据输入低秩优化的子空间聚类模型中,从而获取亲和图;将亲和图输入到二进制哈希算法编码器中进行编码处理,在对编码器进行迭代优化的过程中实现亲和图之间的相互学习;将低秩优化的子空间聚类模型和二进制哈希算法编码器归纳至统一框架中,引入放松矩阵从而构建优化子空间聚类模型;对优化后的子空间聚类模型进行求解,利用迭代更新策略,在固定一个变量的同时,交替更新其他变量,直至收敛;最后利用矩阵分解策略,获得指示矩阵,从而得到聚类结果。2.根据权利要求1所述的一种基于低秩亲和图学习的二进制多视图聚类方法,其特征在于,对所述多视图数据进行非线性核映射,其中非线性核映射采取以下公式进行:其中φ(X
υ
)∈R
N
×
t
表示从第υ个视图得到的t维的非线性映射,η表示核宽度,表示从第υ个视图中随机选取的t个锚点样本,表示第υ个视图的第一个数据,表示表示第υ个视图的第N个数据。3.根据权利要求1所述的一种基于低秩亲和图学习的二进制多视图聚类方法,其特征在于,所述低秩优化的子空间聚类模型为:其中,E
υ
∈R表示了第υ个视图的亲和图,E
*
表示核范数,X
υ
表示第υ个视图的数据。4.根据权利要求1所述的一种基于低秩亲和图学习的二进制多视图聚类方法,其特征在于,所述二进制哈希算法编码器为:s.t.C
υ
C
υT
=I,B∈{

1,+1}
b
×
N
,BB
T
=NI其中,C<...

【专利技术属性】
技术研发人员:王辉兵王帅帅王威姚铭泽崔添翔
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1