半监督情况下判别性的特征选择方法技术

技术编号:17597763 阅读:66 留言:0更新日期:2018-03-31 10:43
本发明专利技术公开了一种半监督情况下判别性的特征选择方法,包括:步骤1,建立Lasso方法的目标函数,基于稀疏理论,引入稀疏化的正则化项,保证样本当中少量的特征被选中;步骤2,为了保留类内样本的紧致性和类间样本的分离性,构建类内图和类间图,并使用两类矩阵去表示;步骤3,在目标函数中再引入判别性正则化项,从而保存同类样本之间的结构信息和不同类样本之间的判别信息,并且重新构建样本数据的相似矩阵;步骤4,引入对角矩阵来推广至半监督学习情况下。该特征选择方法克服了现有技术中特征选择方法的局限性,导致不能获取好的分类性能的问题。

The feature selection method of discriminability in semi supervised case

The present invention discloses the characteristics of a semi supervised discriminant case selection method, which comprises the following steps: 1, the objective function to establish the Lasso method, based on sparse theory, introducing the regular sparse samples, ensure a small number of features is selected; step 2, in order to keep the sample separation within class homogeneity and among the samples, the construction of the class and inter class figure map, and the use of two kinds of matrix to represent; step 3, the introduction of more discriminative regularization term in the objective function, thus preserving the discriminant information between similar structure information between samples and samples of the same class, and re construct the similarity matrix of the sample data; step 4. The introduction of a diagonal matrix is extended to semi supervised learning situations. The feature selection method overcomes the limitation of the feature selection method in the existing technology, which leads to the problem that the good classification performance can not be obtained.

【技术实现步骤摘要】
半监督情况下判别性的特征选择方法
本专利技术涉及模式识别、医学图像分析等领域中的特征选择方法,具体地,涉及一种半监督情况下判别性的特征选择方法。
技术介绍
随着信息化技术的快速发展,一些高维度的数据产生于我们的生活当中,如人脸数据、基因数据等,传统的方法已经不宜对这些高维数据进行处理,因此我们可以采用降维的方式来对高维的数据来进行处理,从而避免所谓的“维数灾难”问题。对于降维的方法,目前我们可以分为特征选择和特征提取。目前比较流行的降维方法有主成分分析方法、线性判别分析方法、Fisher判别分析方法等。这些方法当中,包括无监督学习方法、有监督特征选择方法,其中无监督学习方法只需要无标签的样本,而有监督学习的样本数据则都是有标签的。在实际应用当中,无标签的数据比较容易获取,而一些有标签数据则很难获取,数量也是有限的,因此为了获得更好的分类能力,半监督学习方法被人们提出,相比较与其他类型的方法,该方法能够同时利用无标签样本数据和有标签样本数据,就可以获得更好的分类精度。本专利技术公开了一种半监督情况下判别性的特征选择方法(Semi-Discriminate-Lasso)。在该方法当中,所本文档来自技高网...
半监督情况下判别性的特征选择方法

【技术保护点】
一种半监督情况下判别性的特征选择方法,其特征在于,所述半监督情况下判别性的特征选择方法包括:步骤1,建立Lasso方法的目标函数:

【技术特征摘要】
1.一种半监督情况下判别性的特征选择方法,其特征在于,所述半监督情况下判别性的特征选择方法包括:步骤1,建立Lasso方法的目标函数:其中,训练样本集X=[x1,x2…,xN]∈Rd×N,xi表示第i个样本的特征向量,N表示训练样本个数;d表示特征维数;Y表示这些样本所对应的样本标签向量,且Y=[y1,y2…,yN]∈RN;yi表示样本的类标签,且yi∈{-1,+1};w表示特征向量的回归系数,稀疏正则化项||w||1采用L1-范式将在特征空间中产生一个稀疏解,λ是正则化参数;步骤2,首先构造最近邻图G,即:对于每个样本xi,基于它的k个最近邻定义图G的相应的权重矩阵S:为了保留类内样本的紧致性和类间样本的分离性,对每个样本xi,用它来为节点构建两种类型的图,即:类内图Gw和类间图Gb,为此,将每个样本xi的knn(i)分为两个互不相交的子集:类内图Gw上的权重矩阵Sw以及类间图Gb上的权重矩阵Sb,分别定义如下:步骤3,引入判别性正则化项:Re(w)=ηPw(w)-(1-η)Pb(w),(0≤η≤1);其中,其中,Pw和Pb分别测量类内样本的紧致性和类间样本的分离性,η是调谐参数,用于平衡两项之间相对贡献,对于所述判别性正则化项进行简单的代数运算,可得:Re(w)=ηwTXLwXTw-(1-η)wTXLbXTw(0≤η≤1);其中,Lw=Dw-Sw表示类内图Gw的拉普拉斯矩阵;Lb=Db-Sb表示类间图Gb的拉普拉斯矩阵,Dw和Db分别表示相应的对角矩阵,且Dw(i,j)=∑jSw(i,j)、Db(i,j)=∑jSb(i,j),Sw和Sb可以称为为相似矩阵,为了更好的刻画样本数据之间的相似性,相似矩阵S可以定义为:Sij=exp(-dist(xi,xj)/t);其中,dist(xi,xj)=||xi-xj||2,t使用经验值;所述xi,xj间相似性越高,则f(xi)和f(xj)之间的距离就越小,则引...

【专利技术属性】
技术研发人员:吴锦华伍祥
申请(专利权)人:安徽信息工程学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1