System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于软MFA的半监督子空间聚类方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>兰州大学专利>正文

一种基于软MFA的半监督子空间聚类方法及装置制造方法及图纸

技术编号:40415479 阅读:5 留言:0更新日期:2024-02-20 22:32
本发明专利技术一种基于软MFA的半监督子空间聚类方法及装置,通过映射矩阵,将由多个待聚类样本点生成的样本矩阵映射到低维空间中;基于优化代价函数计算样本矩阵的低秩表示矩阵,用于确定多个待聚类样本点在低维空间中的相似性值,并基于构建的相似性矩阵,对样本矩阵中已进行标记处理的预设数量个待聚类样本点进行标记传播,确定低维空间中的标记矩阵,同时构建内在图和惩罚图,用于计算软MFA正则化项;对联合软MFA正则化项、标记矩阵、映射矩阵和低秩表示矩阵设置的联合优化代价函数进行求解,得到并基于优化映射矩阵、优化标记矩阵和优化低秩表示矩阵进行聚类操作,得到聚类结果;与现有技术相比,本发明专利技术的技术方案能提高聚类性能。

【技术实现步骤摘要】

本专利技术涉及机器学习和图像分析的,特别是涉及一种基于软mfa的半监督子空间聚类方法及装置。


技术介绍

1、在机器学习和图像分析领域,处理大量高维数据的聚类问题是一个备受关注的挑战,研究表明,高维数据通常集中分布在几个低维子空间附近,为了有效地捕捉数据的潜在低维结构,子空间聚类算法被广泛应用;其中半监督子空间聚类(semi-supervisedsubspace clustering,ssc)算法利用部分标记数据来提高聚类性能,受到了特别关注。

2、其中,低秩表达(low rank representation, lrr)模型在半监督子空间聚类中得到了广泛应用,因为它能够有效捕捉数据的全局结构并对噪声和损坏具有鲁棒性;现有的半监督子空间聚类方法通常将无监督lrr扩展为基于图的半监督聚类学习方法。

3、然而,传统的基于低秩表达模型的ssc方法在捕获数据的全局结构方面表现出色,却在一定程度上忽略了数据的局部结构;数据的局部相似性对聚类任务非常重要。目前的一些lrr-ssc方法虽然通过加入适当的正则项获得了较富有信息的数据相似性图(graph)矩阵,但多数算法将相似性矩阵的学习和后续的聚类操作分开进行,这样不能保证得到优化的聚类结果。此外,尽管上述方法的图正则项可以在一定程度上保留数据的局部几何结构,但这些方法未能充分捕获或考虑高维数据中各类数据间的判别信息,导致聚类性能下降。


技术实现思路

1、本专利技术要解决的技术问题是:提供一种基于软mfa的半监督子空间聚类方法及装置,提高聚类性能。

2、为了解决上述技术问题,本专利技术提供了一种基于软mfa的半监督子空间聚类方法,包括:

3、获取多个待聚类样本点,生成样本矩阵,并基于映射矩阵,将所述样本矩阵映射到低维空间中;

4、基于预设的优化代价函数计算所述样本矩阵的低秩表示矩阵,基于所述低秩表示矩阵,确定所述多个待聚类样本点在所述低维空间中的相似性值,构建相似性矩阵,并对选取的所述样本矩阵中预设数量个待聚类样本点进行标记处理,并基于所述相似性矩阵对已标记的所述预设数量个待聚类样本点进行标记传播,确定所述低维空间中的标记矩阵;

5、基于所述相似性矩阵,构建内在图和惩罚图,并根据所述内在图和所述惩罚图计算软mfa正则化项;

6、联合所述软mfa正则化项、所述标记矩阵、所述映射矩阵和所述低秩表示矩阵设置联合优化代价函数,对所述联合优化代价函数进行求解,得到优化映射矩阵、优化标记矩阵和优化低秩表示矩阵;

7、基于所述优化映射矩阵、所述优化标记矩阵和所述优化低秩表示矩阵进行聚类操作,得到聚类结果。

8、在一种可能的实现方式中,基于预设的优化代价函数计算所述样本矩阵的低秩表示矩阵,具体包括:

9、设置优化代价函数,对所述优化代价函数进行求解,得到待聚类样本点的低秩表示矩阵;其中所述优化代价函数如下所示:

10、;

11、;

12、式中,c为低秩表示矩阵,e为自表达误差项矩阵,为矩阵的核范数,其值为低秩表示矩阵的所有奇异值之和,可以用该运算来近似表示低秩表示矩阵的秩,为预设超参数,为映射矩阵,为映射矩阵a的转置,为样本矩阵,为矩阵的2,1范数,是对矩阵的每一列进行欧几里得范数求和的结果,为单位矩阵。

13、在一种可能的实现方式中,基于所述低秩表示矩阵,确定所述多个待聚类样本点在所述低维空间中的相似性值,构建相似性矩阵,具体包括:

14、将所述低秩表示矩阵输入到预设的相似性矩阵转换公式中,得到相似性矩阵,其中,所述相似性矩阵转换公式如下所示:

15、;

16、式中,为相似性矩阵,为低秩表示矩阵c的转置,为取矩阵的对角线元素的倒数构成对角阵,表示元素为全1的向量。

17、在一种可能的实现方式中,基于所述相似性矩阵,构建内在图和惩罚图,具体包括:

18、获取所述相似性矩阵中同类样本点间的第一相似性值,并保留所述第一相似性值,获取所述相似性矩阵中不同类样本点间的第二相似性值,将所述第二相似性值置零,生成内在图;

19、获取所述相似性矩阵中同类样本点间的第三相似性值,将所述第三相似性值置零,获取所述相似性矩阵中不同类样本点间的第四相似性值,计算数值1与所述第四相似性值之间的第一差值,将所述第四相似性值设置为第一差值,构建惩罚图。

20、在一种可能的实现方式中,根据所述内在图和所述惩罚图计算软mfa正则化项,具体包括:

21、基于所述内在图,确定类内紧凑性度量,基于所述惩罚图,确定类间分离性度量;

22、基于所述类内紧凑性度量和所述类间分离性度量,计算软mfa正则化项;

23、其中,所述软mfa正则化项的表达式为,其中,

24、;;

25、;;;

26、;

27、式中,为类内紧凑性度量,为类间分离性度量,为映射矩阵,为映射矩阵a的转置,为样本矩阵,为基于内在图构建的拉普拉斯矩阵,为内在图,为样本矩阵的转置,基于惩罚图构建的拉普拉斯矩阵,为惩罚图,为内在图的度矩阵,为惩罚图的度矩阵,为取矩阵的对角线元素构成对角阵,为正则化参数,表示矩阵求迹运算。

28、在一种可能的实现方式中,联合所述软mfa正则化项、所述标记矩阵、所述映射矩阵和所述低秩表示矩阵设置联合优化代价函数,其中,所述联合优化代价函数如下所示:

29、;

30、;

31、;

32、;

33、式中,为标记矩阵,为已标记点对应的标记矩阵,,分别是非负的低秩表达部分权重参数,是软mfa正则项权重,表示元素为全1的向量,为相似性矩阵,c为低秩表示矩阵,为映射矩阵,e为自表达误差项矩阵,为矩阵的范数,是标记传播项,为矩阵的核范数,为矩阵的2,1范数,为类内紧凑性度量,为类间分离性度量,为正则化参数,为映射矩阵a的转置,为样本矩阵,为单位矩阵,为取矩阵的对角线元素的倒数构成对角阵,为低秩表示矩阵c的转置,为取矩阵的对角线元素构成对角阵,为标记矩阵,为标记矩阵为转置。

34、在一种可能的实现方式中,对所述联合优化代价函数进行求解,得到优化映射矩阵、优化标记矩阵和优化低秩表示矩阵,具体包括:

35、对所述标记矩阵、所述映射矩阵和所述低秩表示矩阵进行初始化处理,得到初始化标记矩阵、初始化映射矩阵和初始化低秩表示矩阵;

36、基于交替迭代算法,对所述初始化标记矩阵、所述初始化映射矩阵和所述初始化低秩表示矩阵进行交替更新处理,直至满足预设停止条件,得到优化映射矩阵、优化标记矩阵和优化低秩表示矩阵。

37、本专利技术还提供了一种基于软mfa的半监督子空间聚类装置,包括:样本点处理模块、低秩表示矩阵生成模块、软mfa正则化项计算模块、联合优化代价函数设置模块和聚类模块;

38、其中,所述样本点处理模块,用于获取多个待聚类样本文档来自技高网...

【技术保护点】

1.一种基于软MFA的半监督子空间聚类方法,其特征在于,包括:

2.如权利要求1所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,基于预设的优化代价函数计算所述样本矩阵的低秩表示矩阵,具体包括:

3.如权利要求1所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,基于所述低秩表示矩阵,确定所述多个待聚类样本点在所述低维空间中的相似性值,构建相似性矩阵,具体包括:

4.如权利要求1所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,基于所述相似性矩阵,构建内在图和惩罚图,具体包括:

5.如权利要求1所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,根据所述内在图和所述惩罚图计算软MFA正则化项,具体包括:

6.如权利要求1所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,联合所述软MFA正则化项、所述标记矩阵、所述映射矩阵和所述低秩表示矩阵设置联合优化代价函数,其中,所述联合优化代价函数如下所示:

7.如权利要求6所述的一种基于软MFA的半监督子空间聚类方法,其特征在于,对所述联合优化代价函数进行求解,得到优化映射矩阵、优化标记矩阵和优化低秩表示矩阵,具体包括:

8.一种基于软MFA的半监督子空间聚类装置,其特征在于,包括:样本点处理模块、低秩表示矩阵生成模块、软MFA正则化项计算模块、联合优化代价函数设置模块和聚类模块;

9.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的基于软MFA的半监督子空间聚类方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的基于软MFA的半监督子空间聚类方法。

...

【技术特征摘要】

1.一种基于软mfa的半监督子空间聚类方法,其特征在于,包括:

2.如权利要求1所述的一种基于软mfa的半监督子空间聚类方法,其特征在于,基于预设的优化代价函数计算所述样本矩阵的低秩表示矩阵,具体包括:

3.如权利要求1所述的一种基于软mfa的半监督子空间聚类方法,其特征在于,基于所述低秩表示矩阵,确定所述多个待聚类样本点在所述低维空间中的相似性值,构建相似性矩阵,具体包括:

4.如权利要求1所述的一种基于软mfa的半监督子空间聚类方法,其特征在于,基于所述相似性矩阵,构建内在图和惩罚图,具体包括:

5.如权利要求1所述的一种基于软mfa的半监督子空间聚类方法,其特征在于,根据所述内在图和所述惩罚图计算软mfa正则化项,具体包括:

6.如权利要求1所述的一种基于软mfa的半监督子空间聚类方法,其特征在于,联合所述软mfa正则化项、所述标记矩阵、所述映射矩阵和所述低秩表示矩阵设置联合优化代...

【专利技术属性】
技术研发人员:吕鑫苏振明柴百非
申请(专利权)人:兰州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1