一种基于稀疏学习耦合互信息的多标签特征选择方法技术

技术编号：38467184 阅读：20 留言：0更新日期：2023-08-11 14:44

本发明专利技术公开了一种基于稀疏学习耦合互信息的多标签特征选择方法，包括以下步骤：输入特征矩阵X、标签矩阵Y及超参数α、β、γ、δ，选择特征数k，初始化标签相关矩阵Z和特征相关矩阵W；根据特征矩阵X计算对角矩阵A以及相似矩阵S，并计算特征矩阵X的图拉普拉斯相似矩阵L

全部详细技术资料下载

【技术实现步骤摘要】
一种基于稀疏学习耦合互信息的多标签特征选择方法

[0001]本专利技术涉及机器学习与模式识别
，尤其是涉及一种基于稀疏学习耦合互信息的多标签特征选择方法。

技术介绍

[0002]多标签学习被广泛应用于如文本分类，图像分析，情绪检测和基因选择等领域。与其他机器学习领域的问题类似，多标签学习也受到“高维诅咒”这一问题的困扰。多标签特征选择方法可以消除不相关和冗余的特征，同时保留信息特征进行分类，可以有效的解决这一问题。而在多标签特征选择方法中，稀疏学习和基于信息论的方法在多标签分别起到了显著的效果。
[0003]然而，在这两种框架中存在三个问题：
[0004](一)基于信息论的方法未充分利用全局变量的相关性。基于信息理论的方法通过计算变量之间的相关性对标签进行学习，如特征与每个标签之间的互信息或特征与标签之间的条件互信息。然而这些方法往往只关注低维的相关性例如：标签与标签，标签与特征或，特征之间的相关性。而事实上高维的相关性也同样会对结果造成影响：例如，一组特征与一些标签有密切的关系，但组中的每个特征与这些...

【技术保护点】

【技术特征摘要】
1.一种基于稀疏学习耦合互信息的多标签特征选择方法，其特征在于，包括以下步骤：S1、输入特征矩阵X、标签矩阵Y及超参数α、β、γ、δ，选择特征数k，根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W；S2、根据特征矩阵X计算对角矩阵A以及相似矩阵S，并计算特征矩阵X的图拉普拉斯相似矩阵L
x
；S3、通过目标函数更新标签相关矩阵Z和特征相关矩阵W，迭代n次，目标函数达到收敛条件后，得到更新后的标签相关矩阵Z
n
和更新后的特征相关矩阵W
n
；S4、根据W
n
的2
‑
范数得到被选择的k个特征。2.根据权利要求1所述的一种基于稀疏学习耦合互信息的多标签特征选择方法，其特征在于，步骤S1中，根据输入的特征矩阵X和标签矩阵Y初始化标签相关矩阵Z和特征相关矩阵W的方法为：计算初始的标签相关矩阵C和初始的特征相关矩阵D，并使Z＝C，W＝D，其中，C
i,j
＝I(l
i
；l
j
)D
i,j
＝I(f
i
；l
j
)C
i,j
表示矩阵C中第i行、第j个元素，D
i,j
表示矩阵D中第i行、第j个元素，I为互信息，l
i
表示第i个标签，f
i
表示第i个特征，l
j
表示第j个标签，f
j
表示第j个特征。3.根据权利要求1所述的一种基于稀疏学习耦合互信息的多标签特征选择方法，其特征在于：步骤S2中，相似矩阵S的计算公式如下：S
i,j
表示矩阵S中第i行、第j个元素，e为自然对数，σ为超参数，N
p
(XW
j.

【专利技术属性】
技术研发人员：高万夫，潘涵林，郝娉婷，李永豪，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人