当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于稀疏学习耦合互信息的多标签特征选择方法技术

技术编号:38467184 阅读:6 留言:0更新日期:2023-08-11 14:44
本发明专利技术公开了一种基于稀疏学习耦合互信息的多标签特征选择方法,包括以下步骤:输入特征矩阵X、标签矩阵Y及超参数α、β、γ、δ,选择特征数k,初始化标签相关矩阵Z和特征相关矩阵W;根据特征矩阵X计算对角矩阵A以及相似矩阵S,并计算特征矩阵X的图拉普拉斯相似矩阵L

【技术实现步骤摘要】
一种基于稀疏学习耦合互信息的多标签特征选择方法


[0001]本专利技术涉及机器学习与模式识别
,尤其是涉及一种基于稀疏学习耦合互信息的多标签特征选择方法。

技术介绍

[0002]多标签学习被广泛应用于如文本分类,图像分析,情绪检测和基因选择等领域。与其他机器学习领域的问题类似,多标签学习也受到“高维诅咒”这一问题的困扰。多标签特征选择方法可以消除不相关和冗余的特征,同时保留信息特征进行分类,可以有效的解决这一问题。而在多标签特征选择方法中,稀疏学习和基于信息论的方法在多标签分别起到了显著的效果。
[0003]然而,在这两种框架中存在三个问题:
[0004](一)基于信息论的方法未充分利用全局变量的相关性。基于信息理论的方法通过计算变量之间的相关性对标签进行学习,如特征与每个标签之间的互信息或特征与标签之间的条件互信息。然而这些方法往往只关注低维的相关性例如:标签与标签,标签与特征或,特征之间的相关性。而事实上高维的相关性也同样会对结果造成影响:例如,一组特征与一些标签有密切的关系,但组中的每个特征与这些标签无关。基于信息理论的方法倾向于消除特征,这丢失了很多信息。
[0005](二)稀疏学习的方法中随机初始化造成的次优化问题。虽然稀疏学习方法可以利用全局变量的相关性,但该类方法需要为设定的变量相关性矩阵进行随机初始化。然而,不同的随机初始化方案不仅降低了该方法的鲁棒性,而且还得到了次优解。
[0006](三)稀疏学习的方法中对于标签的设定难以反应标签的重要程度。多标签数据集的标签是逻辑标签,不能反映每个标签的重要程度。
[0007]以往的稀疏学习方法认为每个标签的重要程度相同,这影响了特征和标签之间的相关性的进一步评估的准确性。因此,这类方法可能无法获得一个最优的特征子集。

技术实现思路

[0008]本专利技术的目的是提供一种基于稀疏学习耦合互信息的多标签特征选择方法,同时部分解决了稀疏学习方法中由随机初始化策略引起的普遍存在的次优解问题,将信息论方法引入到稀疏学习中以获得准确的特征相关性评价。
[0009]为实现上述目的,本专利技术提供了一种基于稀疏学习耦合互信息的多标签特征选择方法,包括以下步骤:
[0010]S1、输入特征矩阵X、标签矩阵Y及超参数α、β、γ、δ,选择特征数k,根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W;
[0011]S2、根据特征矩阵X计算对角矩阵A以及相似矩阵S,并计算特征矩阵X的图拉普拉斯相似矩阵Lx;
[0012]S3、通过目标函数更新标签相关矩阵Z和特征相关矩阵W,迭代n次,目标函数达到
收敛条件后,得到更新后的标签相关矩阵Zn和更新后的特征相关矩阵Wn;
[0013]S4、根据Wn的2

范数得到被选择的k个特征。
[0014]优选的,步骤S1中,根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W的方法为:计算初始的标签相关矩阵C和初始的特征相关矩阵D,并使Z=C,W=D,其中,
[0015]C
i,j
=I(l
i
;l
j
)
[0016]D
i,j
=I(f
i
;l
j
)
[0017]C
i,j
表示矩阵C中第i行、第j个元素,D
i,j
表示矩阵D中第i行、第j个元素,I为互信息,l
i
表示第i个标签,f
i
表示第i个特征,l
j
表示第j个标签,f
j
表示第j个特征。
[0018]优选的,步骤S2中,相似矩阵S的计算公式如下:
[0019][0020]S
i,j
表示矩阵S中第i行、第j个元素,e为自然对数,σ为超参数,Np(XWj.)代表矩阵XW中距离第j个向量最近的p个向量构成的集合;
[0021]对角矩阵A的计算公式为:
[0022][0023]其中,Aii为第i行、第i个元素;
[0024]图拉普拉斯相似矩阵Lx计算公式如下:
[0025]L
x
=A

S。
[0026]优选的,步骤S3中,通过目标函数更新矩阵Z和W包括:
[0027]目标函数为:
[0028][0029]其中,均为福比尼乌斯范数,||W||
2,1
为2

1范数,Tr代表矩阵的迹;
[0030]通过在KKT条件下对目标函数求导,标签相关矩阵Z的更新公式如下:
[0031][0032]特征相关矩阵W的更新公式如下:
[0033][0034]其中,t代表第t次迭代的结果,XT,YT为矩阵X,Y的转置。
[0035]优选的,步骤S3中,迭代n次,目标函数达到收敛条件包括:根据迭代过程中的Wn,Zn计算目标函数的值Fn,通过Fn计算Cver:
[0036]Cver=|Fn

Fn

1|/Fn
‑1[0037]当Cver小于0.001时,目标函数收敛。
[0038]优选的,步骤S4中,根据Wn的2

范数得到被选择的k个特征包括:计算Wn的2

范数||W
ni.
||2,其中,i为更新后特征相关矩阵Wn的第i行,选择||W
ni.
||2最大的k个特征。
[0039]因此,本专利技术采用上述一种基于稀疏学习耦合互信息的多标签特征选择方法,其技术效果如下:
[0040](1)本专利技术部分解决了稀疏学习方法中由随机初始化策略引起的普遍存在的次优解问题,并通过消融实验验证了该方法的可靠性。
[0041](2)本专利技术将信息论方法引入到稀疏学习中以获得准确的特征相关性评价:通过相关性重构特征以及标签矩阵,然后将标签相关性矩阵和特征相关性矩阵集成到一个考虑全局变量相关性策略的稀疏学习框架中。
[0042]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0043]图1为本专利技术SVM分类器对每个数据集的Macro

F1的分类性能图;
[0044]图2为本专利技术SVM分类器对每个数据集的Micro

F1的分类性能图;
[0045]图3为三种方法在四个基准数据集上的收敛曲线图;
[0046]图4为本专利技术SVM分类器的Macro

F1对数据集情绪的参数敏感性分析图。
具体实施方式
[0047]以下通过附图和实施例对本专利技术的技术方案作进一步说明。
[0048]除非另外定义,本专利技术使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。
[0049]对于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于稀疏学习耦合互信息的多标签特征选择方法,其特征在于,包括以下步骤:S1、输入特征矩阵X、标签矩阵Y及超参数α、β、γ、δ,选择特征数k,根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W;S2、根据特征矩阵X计算对角矩阵A以及相似矩阵S,并计算特征矩阵X的图拉普拉斯相似矩阵L
x
;S3、通过目标函数更新标签相关矩阵Z和特征相关矩阵W,迭代n次,目标函数达到收敛条件后,得到更新后的标签相关矩阵Z
n
和更新后的特征相关矩阵W
n
;S4、根据W
n
的2

范数得到被选择的k个特征。2.根据权利要求1所述的一种基于稀疏学习耦合互信息的多标签特征选择方法,其特征在于,步骤S1中,根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W的方法为:计算初始的标签相关矩阵C和初始的特征相关矩阵D,并使Z=C,W=D,其中,C
i,j
=I(l
i
;l
j
)D
i,j
=I(f
i
;l
j
)C
i,j
表示矩阵C中第i行、第j个元素,D
i,j
表示矩阵D中第i行、第j个元素,I为互信息,l
i
表示第i个标签,f
i
表示第i个特征,l
j
表示第j个标签,f
j
表示第j个特征。3.根据权利要求1所述的一种基于稀疏学习耦合互信息的多标签特征选择方法,其特征在于:步骤S2中,相似矩阵S的计算公式如下:S
i,j
表示矩阵S中第i行、第j个元素,e为自然对数,σ为超参数,N
p
(XW
j.

【专利技术属性】
技术研发人员:高万夫潘涵林郝娉婷李永豪
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1