基于排他性正则化的多视图低秩稀疏子空间聚类方法技术

技术编号:23892336 阅读:58 留言:0更新日期:2020-04-22 06:59
本发明专利技术公开了一种基于排他性正则化的多视图低秩稀疏子空间聚类方法。通过对子空间表示系数矩阵的低秩和稀疏约束,同时保证了系数矩阵的低秩性和稀疏性。另外,对不同视图子空间系数矩阵进行排他性约束,使其视图尽可能多样化,以充分利用不同视图之间的信息。然后,利用所得到的系数矩阵,构建一个所有视图共享的关联矩阵。最后,由谱聚类方法对关联矩阵进行聚类操作。本专利采用交替方向乘子法对模型进行求解。通过与已有多视图子空间聚类方法在不同数据集上的实验对比,本专利方法具有更好的聚类性能。

Low rank sparse subspace clustering method based on exclusive regularization

【技术实现步骤摘要】
基于排他性正则化的多视图低秩稀疏子空间聚类方法
本专利技术属于数据处理领域,具体涉及基于排他性正则化的多视图低秩稀疏子空间聚类方法。
技术介绍
在近十几年里,子空间聚类已成为一个热门研究话题。在计算机视觉和图像处理应用中,数据往往是高维的,其通常可由低维子空间表示。当数据点都分布在单个子空间中时,其主要目的是找出子空间的基和数据点的低维表示。常用方法有主成分分析、独立成分分析和非负矩阵分解。另一方面,当数据点分布在不同子空间时,可通过标准聚类算法进行解决,如k-means聚类算法。然而,这些方法是以数据点分布在质心周围的前提下进行的,当数据点随意分布时,将无法获得较好的结果。实际上,同一组数据可由若干不同的表示或视图组成。例如,网页通常包含页面文本和超链接信息;网络上的图像有与之相关的文字说明;在多语言信息检索中,同一文档具有不同语言的多种表示等等。不同视图描述着数据的不同且部分独立的信息,因此,如何集成多个视图信息并探究不同视图间内在结构是多视图学习的主要任务。多视图子空间聚类可以被视为多视图学习的一部分。其主要通过假设不同视图间共享相同的聚类结构,组合来自不同视图的信息,划分基于多个表示的数据点,以获得更精确的聚类结果。近些年,人们提出了大量解决多视图子空间聚类问题的方法。Kumar等人利用对于每个视图中对应数据点具有相同类成员关系的假设,在2011年提出了Co-regularized多视图谱聚类方法。多样性引发的多视图子空间聚类算法利用Hilbert-Schmidt独立准则来探索多视图特征的互补性,以减少多视图之间的信息冗余,提高聚类的准确性。Wang考虑到了不同视图之间的特征表示互补性和表示标签的一致性,提出了一种新的基于位置感知排他性和标签一致性的优化框架,即排他性-一致性正则化多视图子空间聚类算法。但是上述现有技术中,其多视图聚类性能仍然较低,基于排他性正则化的空间聚类方法仍有优化和提升的空间。
技术实现思路
有鉴于此,本专利技术提出了一种基于排他性正则化的多视图低秩稀疏子空间聚类方法,以提高多视图聚类性能。为了实现本专利技术目的,提供了如下技术方案:(1)对于给定的多视图数据X,按照低秩稀疏子空间聚类方法对每个视图数据的表示系数矩阵Z分别进行低秩和稀疏约束。(2)对于不同视图数据,分别对表示系数矩阵Z两两进行排他性约束。(3)采用交替方向乘子法(ADMM)对模型进行求解。(4)利用所得到的系数矩阵Zavg计算关联矩阵W,然后对关联矩阵进行谱聚类操作,得出聚类结果。本专利技术与现有技术相比,具有如下优点:本专利技术对子空间表示系数矩阵分别进行了低秩和稀疏约束,同时保证了系数矩阵的低秩性和稀疏性。其次,为了使不同视图尽可能多样化,引入系数矩阵的排他性约束,使其充分利用不同视图间的互补信息。附图说明图1是本专利技术的流程图;图2是本专利技术基于排他性正则化的多视图低秩稀疏子空间聚类方法(EMLRSSC)在Reuters数据集中的收敛情况;图3是本专利技术基于排他性正则化的多视图低秩稀疏子空间聚类方法(EMLRSSC)在3-sources数据集中的收敛情况;图4是本专利技术基于排他性正则化的多视图低秩稀疏子空间聚类方法(EMLRSSC)在UCIDigit数据集中的收敛情况。具体实施方式参照图1,本专利技术的具体实施过程如下:步骤一,对于给定的多视图数据X,按照低秩稀疏子空间聚类方法对每个视图数据的表示系数矩阵Z分别进行低秩和稀疏约束,其模型为s.t.X(v)=X(v)Z(v)+E(v),diag(Z(v))=0,其中Z(v)∈RN×N,E(v)∈RD×N表示数据带有的噪声,λ1,λ2分别是非负的低秩、稀疏正则化参数。步骤二,对于不同视图数据,分别对表示系数矩阵Z两两进行排他性约束。其排他性约束表示为其中为Hadamard乘积。由于l0范数是非凸的,因此利用其凸代替将上述约束改为该项约束的目的是使不同视图数据尽可能多样化,能充分利用不同视图数据之间的信息。步骤三,采用交替方向乘子法(ADMM)对模型进行求解。步骤四,通过ADMM算法求出表示系数矩阵Zavg后,计算关联矩阵W=(|Zavg|+|Zavg|Τ)/2,然后对关联矩阵W进行谱聚类操作,得出聚类结果。本专利技术的优势由以下实验结果进一步说明。1.实验说明1)选取三个数据集,分别为Reuters、3-sources以及UCIDigit。2)设置λ2=1-λ1;3)本专利技术分别与现有的三种多视图子空间聚类算法(Co-Reg、RMSC、MLRSSC)和两种基于LRSSC算法的方法(SV-LRSSC、FC-LRSSC)在不同数据集上进行聚类性能对比;4)以精确度(Precision)、召回率(Recall)、F值(F-score)、归一化交互信息(NMI)和调整后的随机指数(Adj-RI)作为聚类性能的评价指标。2.实验内容与结果1)将本专利技术与现有的Co-Reg、RMSC、MLRSSC、SV-LRSSC和FC-LRSSC五种方法在不同数据集上的聚类性能进行对比。本实验的目的是:展示在不同数据集下,本专利技术与其他五种方法的聚类性能。图2-图4展示了本专利技术在不同数据集上的收敛情况。表1、表2和表3是在三个不同数据集中,六种方法分别进行聚类操作的评价指标结果。表1Reuters数据集的实验结果(平均值(标准差))表23-sources数据集的实验结果(平均值(标准差))表3UCIDigit数据集的实验结果(平均值(标准差))各种分析的对应名称如下:Co-Reg:多视图谱聚类;RMSC:鲁棒多视图子空间聚类;MLRSSC:多视图低秩稀疏子空间聚类;SV-LRSSC:单视图低秩稀疏子空间聚类;FC-LRSSC:特征连接低秩稀疏子空间聚类。综上所有分析,本专利技术在多视图子空间聚类问题上具有良好的表现,优于其他五种聚类方法。虽然以上将实施例分开说明和阐述,但涉及部分共通之技术,在本领域普通技术人员看来,可以在实施例之间进行替换和整合,涉及其中一个实施例未明确记载的内容,则可参考有记载的另一个实施例。以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。本文档来自技高网
...

【技术保护点】
1.基于排他性正则化的多视图低秩稀疏子空间聚类方法,其特征在于:包括以下步骤:/n(1)对于给定的多视图数据X,按照低秩稀疏子空间聚类方法对每个视图数据的表示系数矩阵Z分别进行低秩和稀疏约束;/n(2)对于不同视图数据,分别对表示系数矩阵Z两两进行排他性约束;/n(3)采用交替方向乘子法对模型进行求解;/n(4)利用所得到的系数矩阵Z

【技术特征摘要】
1.基于排他性正则化的多视图低秩稀疏子空间聚类方法,其特征在于:包括以下步骤:
(1)对于给定的多视图数据X,按照低秩稀疏子空间聚类方法对每个视图数据的表示系数矩阵Z分别进行低秩和稀疏约束;
(2)对于不同视图数据,分别对表示系数矩阵Z两两进行排他性约束;
(3)采用交替方向乘子法对模型进行求解;
(4)利用所得到的系数矩阵Zavg计算关联矩阵W,然后对关联矩阵进行谱聚类操作,得出聚类结果。


2.根据权利要求1所述的基于排他性正则化的多视图低秩稀疏子空间聚类方法,其特征在于:在步骤(1)中,对每个视图数据的表示系数矩阵Z分别进行低秩和稀疏约束,其表达式为



s.t.X(v)=X(v)Z...

【专利技术属性】
技术研发人员:曹飞龙张清华
申请(专利权)人:广东石油化工学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1