一种基于局部特征相关和高阶标签的稀疏特征选择方法技术

技术编号：39159891 阅读：15 留言：0更新日期：2023-10-23 15:02

本发明专利技术属于数据分类技术领域，具体涉及一种基于局部特征相关和高阶标签的稀疏特征选择方法，该方法通过将样本矩阵和标签矩阵输入至目标函数中进行迭代更新，该目标函数根据样本矩阵和标签矩阵预选特征子集；根据局部特征相关性函数以及高阶标签信息函数确定两个标签之间的相关性；并在达到设定的停止规则时停止迭代更新过程，按照设定排序输出的特征子集。因本发明专利技术的方法结合了高阶标签的特点，充分利用、挖掘标签背后的隐藏信息，并显式地指出两个标签之间的相关性，进而能够准确的反映局部特征之间的关联性，以提高多标记数据的分类性能，提高了特征选择结果的准确性。提高了特征选择结果的准确性。提高了特征选择结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于局部特征相关和高阶标签的稀疏特征选择方法

[0001]本专利技术属于数据分类
，具体涉及一种基于局部特征相关和高阶标签的稀疏特征选择方法。

技术介绍

[0002]多标签分类能够解决具有丰富语义的现实任务，具体而言，在多标签分类中，一个实例可能与多个标签相关联。例如，一幅图像可能与一组标签相关联，一条新闻可能属于多个主题。与传统的单标签分类问题相比，多标签分类问题由于输出空间的巨大规模使得其成为一项更具挑战性的任务。研究表明，具有大量冗余和噪声的高维数据广泛出现于现实生活中。高维数据所引起的“维数灾难”会降低模型的性能。因此，研究者们提出了两种降维技术来解决这一问题：特征提取和特征选择。特征提取是将样本从高维输出空间通过线性或非线性映射投影到一个低维空间得到新的特征集合。很显然，这类方法虽然降低了样本的维数，但却失去了特征原有的语义信息，无法有效去除无关和冗余特征。特征选择则有效解决了这一问题，特征选择是指从原始的特征集合中用计算的方法按照评价准则选择出部分具有良好区分特性的特征进行分类。其目的是根据一些准则选出最小的特征子集，使分类等任务达到和特征选择前近似甚至更好的效果。因此特征选择更具解释性和意义，并被广泛应用于生物信息学、医学、材料化学和经济学等各个领域。
[0003]大多数的特征选择方法主要针对单标记学习，随着多标记学习的普及，越来越多的学者开始关注多标记问题的研究。目前，有很多针对于多标记数据的特征选择算法被提出：Fan等人撰写的《Multi
‑
label featu...

【技术保护点】

【技术特征摘要】
1.一种基于局部特征相关和高阶标签的稀疏特征选择方法，其特征在于，包括如下步骤：1)输入样本矩阵和标签矩阵至目标函数中进行迭代更新，所述目标函数根据样本矩阵和标签矩阵预选特征子集；根据局部特征相关性函数以及高阶标签信息函数确定两个标签之间的相关性；2)在达到设定的停止规则时停止迭代更新过程，按照设定排序输出的特征子集，选取该输出的特征子集中的前设定个数的子集形成新的子集，将新的子集作为最终的特征子集。2.根据权利要求1所述的基于局部特征相关和高阶标签的稀疏特征选择方法，其特征在于，步骤1)中，所述目标函数通过基于l
2,1
范数的正则化损失函数探究标签与特征之间的关系。3.根据权利要求2所述的基于局部特征相关和高阶标签的稀疏特征选择方法，其特征在于，基于l
2,1
范数的正则化损失函数为：其中，W为特征系数矩阵；||XW
‑
Y||
F
表示Frobenius范数；λ为一个超参数；||W||
2,1
表示W的l
2,1
范数。4.根据权利要求1所述的基于局部特征相关和高阶标签的稀疏特征选择方法，其特征在于，步骤1)中，局部特征相关性函数基于流形约束和拉普拉斯分数建立。5.根据权利要求4所述的基于局部特征相关和高阶标签的稀疏特征选择方法，其特征在于，所述局部特征相关性函数中基于拉普拉斯分数所建立的函数为：其中Lp＝(L+L
T
)/2，L＝G
‑
...

【专利技术属性】
技术研发人员：孙林，马雨萱，王振华，魏然，
申请(专利权)人：河南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人