一种面向层次网络数据的无监督特征选择方法技术

技术编号:23766608 阅读:49 留言:0更新日期:2020-04-11 20:10
本发明专利技术公开了一种面向层次网络数据的无监督特征选择方法,其特征在于:(1)使用矩阵分解建立无监督特征选择方法基础模型,并引入使用了l_2,1范数的正则项增强模型的鲁棒性及达到使特征评分矩阵行稀疏的目的;(2)使用多次非负矩阵分解获取网络中的多层层次结构信息并与特征选择模型巧妙地结合到一起,使两者互相促进以达到更好的模型效果;(3)使用交替方向乘子算法对模型进行求解。本发明专利技术在进行特征选择的过程中,同时利用了网络中的特征信息和多层层次结构信息,将两者统一到同一个特征选择模型中以达到求解出更准确的特征评分矩阵的目的,同时提出了一种针对该模型的交替更新算法。

An unsupervised feature selection method for hierarchical network data

【技术实现步骤摘要】
一种面向层次网络数据的无监督特征选择方法
本专利技术属于层次网络数据上的无监督特征选择
,特别涉及一种面向层次网络数据的无监督特征选择方法。
技术介绍
网络数据存在于许多高影响力领域中,从社交网络,协作平台到生物系统。在这样的网络中,节点通常拥有高维特征,同时彼此间通过各类关系相连接。但是由于高维特征所带来的“维数灾难”,使得在利用此类网络数据进行进一步的研究和挖掘前,需要先做维数缩减,通常是使用特征选择来完成;又由于标签信息获取的不易性,无监督特征选择方法自然成为首选。大部分无监督的特征选择方法注重从特征/属性中获取信息,而忽略了网络结构中蕴含的大量有益信息;即使少部分考虑了结构信息的方法,也只是假设网络上的节点是以平面结构组织的。但实际上,大多数网络中的节点可以组织成分层结构。例如,在协作网络中,可以将研究人员以最粗糙的级别聚集到不同的研究领域中,并以更细粒度的级别进一步指定到不同的子领域中。研究表明,这种分层结构有利于各类学习任务的完成,包括聚类和矩阵填充等。因此本专利技术提出了一种面向层次网络数据的无监督特征选择方法。针对网络的无本文档来自技高网...

【技术保护点】
1.一种面向层次网络数据的无监督特征选择方法,其特征在于,包括以下步骤:/n步骤1,建立无监督特征选择方法基础模型;/n步骤2,获取多层层次结构信息并与特征选择模型结合,得到特征选择模型;/n步骤3,对于步骤2得到的特征选择模型,使用交替更新的方法进行求解,得到的特征评分矩阵。/n

【技术特征摘要】
1.一种面向层次网络数据的无监督特征选择方法,其特征在于,包括以下步骤:
步骤1,建立无监督特征选择方法基础模型;
步骤2,获取多层层次结构信息并与特征选择模型结合,得到特征选择模型;
步骤3,对于步骤2得到的特征选择模型,使用交替更新的方法进行求解,得到的特征评分矩阵。


2.根据权利要求1所述的一种面向层次网络数据的无监督特征选择方法,其特征在于,步骤1具体包括:
1)设X∈Rn×d为特征矩阵,为d个特征,其中f1,...fd代表对应的特征向量并假设每个特征都被归一化,即||fj||2=1,j=1,...,d;通过下面的矩阵分解模型将X聚为k类(C1,C2,...,Ck):



s.t.V∈{0,1}n×k,VT1=1
其中V∈Rn×k表示聚类标识矩阵也视为某种标签矩阵,W∈Rd×k表示潜在特征矩阵即所需的特征评分矩阵;将矩阵V的约束条件松弛到正交,即VTV=I,V≥0,将无监督特征选择方法基础模型转变为:



s.t.VTV=I,V≥0;
2)通过在基础模型中引入正则化项,增强模型的鲁棒性;由于W∈Rd×k表示特征评分矩阵,其中每一行wi表示对第i个特征的评分,通过对矩阵W添加l2,1范数使W能够做到行稀疏,将这一正则化项加入到无监督特征选择方法基础模型中:



s.t.VTV=I,V≥0
其中α是一个常数,用于控制正则化项在模型中的权重。


3.根据权利要求1所述的一种面向层次网络数据的无监督特征选择方法,其特征在于,步骤2具体包括:
(1)首先获取网络中的单层层次结构信息;设A∈Rn×n为网络G的邻接矩阵,通过对矩阵A做非负矩阵分解来对网络中的点的隐藏表示进行建模:



s.t.U≥0,V≥0
其中对上式的求解视为一个网络中的聚类过程,具体来说,矩阵U的每一列代表了一个簇的潜在定义,而矩阵V的每一行则代表了网络中的点与k个簇之间的归属关系,U(i,l)V(l,j)被视为第l个簇对边A(i,j)所做的贡献,即为点i和点j之间的关系;通过上式获取单层层次结构信息,即簇的单层表示矩阵U,以及网络中的点对聚类的归属矩阵V;
(2)在上式的基础上进一步获取网络中的多层层次结构信息;通过对上式中簇的单层表示矩阵U进行进一步分解来获取隐含的多层层次结构信息:
A≈U1U2...UpVT
其中且n=r0≥r1≥…≥rp=k;使用l2,1范数增强模型的鲁棒性;结合以上两点,提出以下目标函数来学习网络中的多层层次结构信息:



s.t.V≥0,Ui≥0,i∈1,2,...,p
其中,原本簇的单层表示矩阵U被进一步分解为p个非负矩阵U1,U2,...,Up,每个矩阵Ui表示簇的第i层和第i+1层之间的联系,共同组成了簇的多层层次结构信息;
(3)最后将网络中的多层层次结构信息与无监督特征选择方法基础模型相结合;将上式中网络中的点对聚类的归属矩阵V作为无监督特征选择方法基础...

【专利技术属性】
技术研发人员:罗敏楠张玉哲郑庆华秦涛
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1