System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自步学习的多视图数据无监督特征选择方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>西南大学专利>正文

基于自步学习的多视图数据无监督特征选择方法及装置制造方法及图纸

技术编号:41403877 阅读:7 留言:0更新日期:2024-05-20 19:29
本发明专利技术公开了基于自步学习的多视图数据无监督特征选择方法及装置,涉及机器学习领域,其技术方案要点是:对目标对象的多视图数据进行拼接,得到包含所有视图信息的数据矩阵;构建包含自步学习和稀疏性学习的无监督特征选择模型;引入超图约束,构建每个视图数据的超图拉普拉斯矩阵,并根据视图的视图质量为对应的超图拉普拉斯矩阵分配自适应视图权重;在无监督特征选择模型的基础上结合每个视图数据的超图拉普拉斯矩阵作为学习条件,建立多视图无监督特征选择模型,基于所述多视图无监督特征选择模型对所述数据矩阵进行无监督特征选择,获得被选择的特征子集。本发明专利技术缓解了现有技术的无监督特征选择的非凸性,以及存在的异常值和严重噪声的问题。

【技术实现步骤摘要】

本专利技术涉及机器学习领域,更具体地说,它涉及基于自步学习的多视图数据无监督特征选择方法及装置


技术介绍

1、多视图无监督特征选择(mufs)是异构数据降维的有效方法。

2、然而,现有的多视图无监督特征选择方法大多为样本分配相同的权重,因此没有有效地利用样本的多样性。此外,由于各种正则项的存在,所构建的多视图无监督特征选择模型通常是非凸的,使得很难找到最优解。


技术实现思路

1、本专利技术的目的是提供基于自步学习的多视图数据无监督特征选择方法及装置,以缓解现有技术的无监督特征选择的非凸性,以及存在的异常值和严重噪声的问题。

2、本申请的第一方面,提供了一种基于自步学习的多视图数据无监督特征选择方法,方法包括:

3、对目标对象的多视图数据进行拼接,得到包含所有视图信息的数据矩阵;

4、构建包含自步学习和稀疏性学习的无监督特征选择模型;

5、引入超图约束,构建每个视图数据的超图拉普拉斯矩阵,并根据视图的视图质量为对应的超图拉普拉斯矩阵分配自适应视图权重;

6、在无监督特征选择模型的基础上结合每个视图数据的超图拉普拉斯矩阵作为学习条件,建立多视图无监督特征选择模型,基于所述多视图无监督特征选择模型对所述数据矩阵进行无监督特征选择,获得被选择的特征子集。

7、在上述过程中,多视图数据被两次平行使用,第一次使用时,多视图数据被拼接成一个包含所有视图信息的数据矩阵,作为无监督特征选择的输入,在无监督特征选择框架中嵌入了自步学习和稀疏学习,其中自步学习有助于缓解模型的非凸性,而稀疏学习确保了所选择特征的判别性。第二次使用时,多视图数据用于构建多视图数据的超图拉普拉斯矩阵,以保持数据流形结构,在此过程中,不同视图数据的超图被自适应地分配权重,以学习不同视图之间潜在的相关性和多样性信息。基于两次平行使用,使得建立的多视图无监督特征选择模型缓解了现有技术的无监督特征选择问题的非凸性,以及存在的异常值和严重噪声的问题。

8、在一种实现方式中,所述无监督特征选择模型的表达式为其中,c表示特征权重矩阵,p表示含有聚类信息的伪标签矩阵,q表示样本权重向量,q表示由q构造的对角阵,f(∈,q)表示自步学习的正则项,∈表示控制参数,β表示正则项参数,x表示拼接的数据矩阵,t表示矩阵转置操作。

9、在一种实现方式中,所述自步学习的正则项f(∈,q)的表达式为其中,n表示输入数据所含样本数,ρ表示控制参数。

10、在一种实现方式中,所述多视图无监督特征选择模型的表达式为:

11、其中,lv表示第v个视图的超图拉普拉斯矩阵,λv表示第v个视图的视图权重,σ表示正则项参数,tr表示迹运算,pt表示伪标签矩阵的转置,r表示超参数。

12、在一种实现方式中,所述多视图无监督特征选择模型的约束条件的表达式为

13、本申请的第二方面,提供了一种基于自步学习的多视图数据无监督特征选择装置,装置包括:

14、数据拼接模块,用于对目标对象的多视图数据进行拼接,得到包含所有视图信息的数据矩阵;

15、无监督特征选择模型构建模块,用于构建包含自步学习和稀疏性学习的无监督特征选择模型;

16、超图拉普拉斯矩阵构建模块,用于引入超图约束,构建每个视图数据的超图拉普拉斯矩阵,并根据视图的视图质量为对应的超图拉普拉斯矩阵分配自适应视图权重;

17、特征选择模块,用于在无监督特征选择模型的基础上结合每个视图数据的超图拉普拉斯矩阵作为学习条件,建立多视图无监督特征选择模型,基于所述多视图无监督特征选择模型对所述数据矩阵进行无监督特征选择,获得被选择的特征子集。

18、在一种实现方式中,所述无监督特征选择模型的表达式为其中,c表示特征权重矩阵,p表示含有聚类信息的伪标签矩阵,q表示样本权重向量,q表示由q构造的对角阵,f(∈,q)表示自步学习正则项,∈表示控制参数,β表示正则项参数,x表示拼接的数据矩阵,t表示矩阵转置操作。

19、在一种实现方式中,所述自步学习的正则项f(∈,q)的表达式为其中,n表示输入数据所含样本数,ρ表示控制参数。

20、在一种实现方式中,述多视图无监督特征选择模型的表达式为:

21、其中,lv表示第v个视图的超图拉普拉斯矩阵,λv表示第v个视图的视图权重,σ表示正则项参数,tr表示迹运算,pt表示伪标签矩阵的转置,r表示超参数。

22、在一种实现方式中,所述多视图无监督特征选择模型的约束条件的表达式为

23、与现有技术相比,本专利技术具有以下有益效果:

24、在本专利技术提供的一种基于自步学习的多视图数据无监督特征选择方法中,首先,输入目标对象的多个视图方向的多视图数据,多视图数据被两次平行使用,第一次使用时,多视图数据被拼接成一个包含所有视图信息的数据矩阵,作为无监督特征选择的输入,在无监督特征选择框架中嵌入了自步学习和稀疏学习,其中自步学习有助于缓解模型的非凸性,而稀疏学习确保了所选择特征的判别性。第二次使用时,多视图数据用于构建多视图数据的超图拉普拉斯矩阵,以保持数据流形结构,在此过程中,不同视图数据的超图被自适应地分配权重,以学习不同视图之间潜在的相关性和多样性信息。基于两次平行使用,使得建立的多视图无监督特征选择模型缓解了现有技术的无监督特征选择问题的非凸性,以及存在的异常值和严重噪声的问题。

本文档来自技高网...

【技术保护点】

1.一种基于自步学习的多视图数据无监督特征选择方法,其特征在于,方法包括:

2.根据权利要求1所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述无监督特征选择模型的表达式为其中,C表示特征权重矩阵,P表示含有聚类信息的伪标签矩阵,q表示样本权重向量,Q表示由q构造的对角阵,f(∈,q)表示自步学习的正则项,∈表示控制参数,β表示正则项参数,X表示拼接的数据矩阵,T表示矩阵转置操作。

3.根据权利要求2所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述自步学习的正则项f(∈,q)的表达式为其中,n表示输入数据所含样本数,ρ表示控制参数。

4.根据权利要求2所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述多视图无监督特征选择模型的表达式为:

5.根据权利要求4所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述多视图无监督特征选择模型的约束条件的表达式为

6.一种基于自步学习的多视图数据无监督特征选择装置,其特征在于,装置包括:

7.根据权利要求6所述的基于自步学习的多视图数据无监督特征选择装置,其特征在于,所述无监督特征选择模型的表达式为其中,C表示特征权重矩阵,P表示含有聚类信息的伪标签矩阵,q表示样本权重向量,Q表示由q构造的对角阵,f(∈,q)表示自步学习正则项,∈表示控制参数,β表示正则项参数,X表示拼接的数据矩阵,T表示矩阵转置操作。

8.根据权利要求7所述的基于自步学习的多视图数据无监督特征选择装置,其特征在于,所述自步学习的正则项f(∈,q)的表达式为其中,n表示输入数据所含样本数,ρ表示控制参数。

9.根据权利要求7述的基于自步学习的多视图数据无监督特征选择装置,其特征在于,述多视图无监督特征选择模型的表达式为:

10.根据权利要求9所述的基于自步学习的多视图数据无监督特征选择装置,其特征在于,所述多视图无监督特征选择模型的约束条件的表达式为

...

【技术特征摘要】

1.一种基于自步学习的多视图数据无监督特征选择方法,其特征在于,方法包括:

2.根据权利要求1所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述无监督特征选择模型的表达式为其中,c表示特征权重矩阵,p表示含有聚类信息的伪标签矩阵,q表示样本权重向量,q表示由q构造的对角阵,f(∈,q)表示自步学习的正则项,∈表示控制参数,β表示正则项参数,x表示拼接的数据矩阵,t表示矩阵转置操作。

3.根据权利要求2所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述自步学习的正则项f(∈,q)的表达式为其中,n表示输入数据所含样本数,ρ表示控制参数。

4.根据权利要求2所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述多视图无监督特征选择模型的表达式为:

5.根据权利要求4所述的基于自步学习的多视图数据无监督特征选择方法,其特征在于,所述多视图无监督特征选择模型的约束条件的表达式为

【专利技术属性】
技术研发人员:车杭骏杨暄皓潘柏丞郭伟
申请(专利权)人:西南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1