当前位置: 首页 > 专利查询>云南大学专利>正文

无属性网络中融合图嵌入和结构增强的分类方法及系统技术方案

技术编号:33649165 阅读:32 留言:0更新日期:2022-06-02 20:26
本发明专利技术属于网络节点分类技术领域,公开了一种无属性网络中融合图嵌入和结构增强的分类方法及系统,所述无属性网络中融合图嵌入和结构增强的分类方法包括:提出基于节点向量重构的网络表示学习方法,利用部分有标签节点在网络结构中呈现出来的高阶语义信息对网络结构进行增强,并在增强后的网络中再重新学习节点向量表示;利用机器学习分类算法来对节点向量表示进行分类,从而将网络中节点分配不同类别。本发明专利技术提出一种基于节点向量重构的图嵌入方法,通过快速迭代的方式将网络中节点之间局部关系嵌入到节点向量表示之中;给出一种网络结构增强方法,使用部分有标签的节点信息对网络结构进行增强,尽可能改善网络结构质量,提高模型分类性能。高模型分类性能。高模型分类性能。

【技术实现步骤摘要】
无属性网络中融合图嵌入和结构增强的分类方法及系统


[0001]本专利技术属于网络节点分类
,尤其涉及一种无属性网络中融合图嵌入和结构增强的分类方法及系统。

技术介绍

[0002]目前,网络作为一种强大的存储关系信息的载体,其蕴涵着的丰富信息对本专利技术研究相应邻域具有很高学术和应用价值,因此如何挖掘这些网络的信息成为了科研界重要的关注点之一;同时节点分类作为很重要网络分析中的一项研究内容,也受到了很多研究人员的关注,并广泛应用于社交网络用户画像分析、引文网络文献分类、风控系统异常检测等领域。然而很多情况下,由于用户不愿意进行分享、用户信息隐私、或者测量困难等原因,使得收集到的网络中节点相关数据往往有限。以社交网络facebook为例,超过90%的facebook用户不愿透露他们的政治观点,即社交网络中有部分用户的属性内容是未知的。因此当节点属性未知的情况下,研究如何仅利用网络拓扑结构和部分节点的标签信息高效地对节点进行分类就非常关键且具有重要意义。
[0003]目前,基于图嵌入(也称为网络表示学习)的分类方式成为了节点分类问题研究本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种无属性网络中融合图嵌入和结构增强的分类方法,其特征在于,所述无属性网络中融合图嵌入和结构增强的分类方法包括:提出基于节点向量重构的网络表示学习方法,利用部分有标签节点在网络结构中呈现出来的高阶语义信息对网络结构进行增强,并在增强后的网络中再重新学习节点向量表示;利用机器学习分类算法来对节点向量表示进行分类,从而将网络中节点分配不同类别。2.如权利要求1所述无属性网络中融合图嵌入和结构增强的分类方法,其特征在于,所述无属性网络中融合图嵌入和结构增强的分类方法包括以下步骤:步骤一,通过表示学习节点向量重构的网络提取节点在网络中的局部结构,并嵌入到低维、稠密的向量空间中,获得网络中节点的向量表示;步骤二,利用网络中节点的向量表示和部分节点标签信息,向网络结构中融入部分节点在网络结构中表现出来的高阶语义信息,增强网络的拓扑结构;步骤三,利用基于节点向量重构的图嵌入学习节点在网络中增强后的局部结构,在节点向量表示中嵌入部分有标签节点的高阶语义信息;步骤四,利用机器学习算法对节点向量表示进行分类,实现节点分类。3.如权利要求1所述的无属性网络中融合图嵌入和结构增强的分类方法,其特征在于,基于图嵌入的无属性网络节点分类问题描述包括:给定网络G=(V,E)和部分节点的标签L
part
,其中V表示网络的节点集,E表示网络中的边集,|V|是节点数量;无属性网络节点分类问题描述为根据网络G的拓扑结构和部分节点的标签L
part
,标注其他没有标签节点的标签;构建在欧几里得空间高效表示网络数据的方法,找到映射器f,将网络G中的节点v
i
∈V映射到欧几里得空间上的d维向量表示t
i
,并在t
i
中尽可能多的包含节点v
i
在网络中相关结构信息,拼接网络中所有节点的向量表示得到|v|*d维的矩阵T;记T为网络G的嵌入表示,t
i
是矩阵T的第i行向量,对应于节点v
i
向量表示,则图嵌入过程表示为:T=f(G=(V,E));在节点在欧几里得空间上表示后,节点半监督分类问题变成传统的欧几里得空间上的数据分类问题,利用已有标签的数据训练分类器f
c
后,利用训练好的分类器f
c
对没有标签的节点进行标注,得到所有节点标签L
all
:L
all
=f
c
(T,L
part
)。4.如权利要求1所述的无属性网络中融合图嵌入和结构增强的分类方法,其特征在于,所述无属性网络中融合图嵌入和结构增强的分类方法还包括GESE算法的构建,ERLNC算法中的图嵌入部分采用两阶段学习策略,第一阶段初步学习原网络的拓扑结构,得到原网络的嵌入表示;第二阶段利用已知的部分节点的标签信息和学出来的原网络嵌入表示来对网络结构进行增强,向网络结构中加入部分有标签节点的高阶语义信息,在第一阶段得到的网络嵌入基础上再学习增强的网络结构和嵌入表示后,在得到的网络向量表示基础上利用分类器对节点进行分类;在两个阶段学习网络向量表示时,GESE都采用构建的基于节点向量重构的图嵌入方法,所述GESE算法分为基于节点向量重构的图嵌入方法,网络结构增强和节点分类三个部分。5.如权利要求2所述的无属性网络中融合图嵌入和结构增强的分类方法,其特征在于,所述步骤一中,基于节点向量重构的图嵌入包括:
构建基于节点向量重构的图嵌入算法,以迭代的方式用邻域节点向量表示重构节点向量表示,逐步提高节点向量中含有的局部结构信息量;其中,所述基于节点向量重构的图嵌入算法包括:输入:网络G,网络G初始嵌入表示T

,算法迭代次数iter输出:网络G的嵌入表示T

for_inrange(iter):

sim=[]/*计算节点向量之中节点局部结构信息嵌入程度*/

forv
i
inV:

获取节点v
i
正样本集和负样本集和负样本集和负样本集和负样本集

endfor

对节点集V按d
i
值从小到大排序/*重构节点向量表示*/

forv
k
inM:从v
k
的邻居节点集中,按节点的d
i
值以轮盘赌方式采样出deg(v
k
)个节点,记)个节点,记P
k
'=[]forjinrange(deg(v
k
)):获取有序集合的j个节点,记为的j个节点,记为获取节点对应向量表示第j个片段,记为对应向量表示第j个片段,记为对应向量表示第j个片段,记为endfor按顺序拼接P

k
中所有片段,获得节点v
k
新的向量表示t
k
endforEndfor;所述基于节点向量重构的图嵌入算法还包括:(1)计算节点向量之中节点局部结构信息嵌入程度节点局部结构是指节点与其邻域节点之间关系,在向量空间中用向量之间相似程度表示对应节点之间邻近程度,网络中越邻近的节点对在向量空间中的向量表示越相似,距离越远的节点对在向量空间中的向量表示越不相似;从这个角度出发,提出计算网络中节点向量中的节点局部信息嵌入程度的方法;设v
i
表示网络中的一个节点,t
i
是节点v
i
的向量表示,是节点v
i
的一阶邻居的向量表
示的集合;分析节点v
i
的一阶邻域,获得一阶邻居节点向量集并将视为节点v
i
正样本集来计算t
i
和之间平均余弦相似度之间平均余弦相似度式中,符号
·
表示向量内积,||t
i
||表示向量t
i
的二范式,表示向量集中元素个数;从网络中选择与v
i
不相连的个节点向量表示作为负样本集并计算t
i
与他们的平均余弦相似度平均余弦相似度通过计算和之间的差来获得节点v
i
的嵌入表示t
i
中所含节点局部结构信息的程度d
i
:(2)重构节点向量表示构建节点向量表示重构算子,在每次迭代时利用节点的一阶邻域节点的向量表示的片段重新构造该节点的向量表示,提高节点向量中节点的局部结构嵌入程度;设v
k
为网络中一个节点,重构节点v
k
的向量表示时,从v
k
的邻居节点集中,按节点的d
i
值以轮盘赌方式采样出deg(v
k
)个节点,采样得出的有序集合记为)个节点,采样得出的有序集合记为中的第i个节点记为将中每个节点的向量表示分成deg(v
k
)个等长度的片段,由中第一个节点的向量表示的片段组成的集合表示为:式中,为节点中第一个节点的向量表示的第i个片段;将节点对应向量片段集合按节点在中的循序...

【专利技术属性】
技术研发人员:郁湧艾合买提尼牙孜钱天宇许祝愿刘金卓
申请(专利权)人:云南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1