一种基于自适应图扩散的判别多标签特征选择方法技术

技术编号：38720480 阅读：11 留言：0更新日期：2023-09-08 23:15

本发明专利技术公开了一种基于自适应图扩散的判别多标签特征选择方法，包括获取训练样本的特征矩阵和标签矩阵；对训练样本的特征计算初始相似矩阵；将原始特征投影到隐表示空间，在该隐空间中对初始相似矩阵进行自适应图扩散，以挖掘样本间的高阶结构信息；基于HSIC准则，最大化隐表示与类标签间的依赖性；建立基于自适应图扩散的判别多标签特征选择模型；设计迭代算法求解模型，输出特征排序，选取特征子集。该方法同时学习特征选择矩阵、隐表示和相似图，在隐空间中自动探索样本间的高阶结构信息，避免了原始特征中冗余信息和噪声对数据结构的负面影响。通过最大化隐表示与类标签间的依赖性，将监督信息融入到特征选择过程，提升了所选特征的判别性能。选特征的判别性能。选特征的判别性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应图扩散的判别多标签特征选择方法

[0001]本专利技术属于人工智能
，涉及一种基于自适应图扩散的判别多标签特征选择方法。

技术介绍

[0002]多标签学习(MLL)旨在学习样本与多个标签间的依赖关系，已广泛应用于信息检索、文本分类、情感识别等领域。随着信息技术的快速发展，MLL中使用的数据的特征维度正在急剧增长。高维特征不仅增加了学习模型的复杂度和内存消耗，而且降低了模型性能。维数约简是解决上述问题的有效方法，主要包括特征提取和特征选择。前者将原始特征映射到低维子空间，而后者直接从整个特征中选择一部分特征子集。两种方案的区别在于：特征提取创建了新特征，丧失了原始数据的实际意义，特征选择获得的特征子集则可以很好地保留原始特征的实际意义。
[0003]现有的特征选择方法主要可以分为三种：过滤法、包裹法和嵌入法。过滤方法使用数据本身的信息对特征进行排序，独立于学习算法；包裹法通常对于既定的度量标准使用启发式算法选择性能最佳的特征，复杂度高且对噪声敏感；嵌入式方法将特征选择集成到模型训练中，然后通过优化模型获得最佳特征子集。与过滤法和包裹法相比，嵌入方法能够以较低的计算代价获取判别性高的特征子集。传统的嵌入式特征选择方法主要包括判别投影学习和稀疏正则化两个模块。近年来，稀疏回归已被广泛应用于多标签特征选择，但是现有技术中的方法不仅忽略了样本间的结构性信息，而且不能准确地描述样本和标签间的非线性依赖关系。通过改进，一些技术中的方法所选特征保留了数据的一些结构信息，但仍然存在以下两个问题：
①...

【技术保护点】

【技术特征摘要】
1.一种基于自适应图扩散的判别多标签特征选择方法，其特征在于，包括以下步骤：获取训练样本的特征矩阵X和标签矩阵Y，其中特征矩阵X共n行d列，每行对应一个样本，每列对应一个特征；标签矩阵Y为n行c列的0
‑
1矩阵，1表示样本与标签相关，0表示样本与标签不相关；对训练样本的特征矩阵X采用高斯核计算初始相似矩阵S；将特征矩阵X投影至隐空间V，同时对初始相似矩阵S进行自适应图扩散，学得最优相似矩阵A；引入希尔伯特
‑
施密特独立准则，最大化隐表示V与标签Y间的依赖性；建立基于自适应图扩散的判别多标签特征选择模型；设计交替优化算法对模型进行求解，输出特征排序。2.如权利要求1所述的一种基于自适应图扩散的判别多标签特征选择方法，其特征在于，所述对训练样本的特征矩阵X采用高斯核计算初始化相似矩阵S，具体表示为：3.如权利要求1所述的一种基于自适应图扩散的判别多标签特征选择方法，其特征在于，所述自适应图扩散的判别多标签特征选择模型具体表示为：其中，W表示特征选择矩阵；λ1、λ2、λ3和λ4表示权重因子；H表示中心化矩阵；表示第i个对角元素为的对角矩阵。4.如权利要求1所述的一种基于自适应图扩散的判别多标签特征选择方法，其特征在于，利用所述交替优化算法对模型进行求解，输出特征排序具体包括以下步骤：引入辅助变量Z，对模型进行分离，得到可分离的优化问题，具体表示为：当||w
i
||2≠0时，||W||
2,1
＝2tr(W
T
UW)，是对角矩阵，其第i个对角线元素建立优化问题(2)的增广拉格朗日函数；对特征选择矩阵W、隐表示矩阵V、辅助变量Z、最优相似矩阵A和拉格朗日乘数C以及惩罚参数μ交替进行更新，直至算法收敛；
根据||w
i
||2(i＝1,2,...,d)的降序对特征进行排序，输出排序结果。5.如权利要求4所述的一种基于自适应图扩散的判...

【专利技术属性】
技术研发人员：马家军，徐飞，
申请(专利权)人：西安工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人