【技术实现步骤摘要】
一种基于个性化网页排位的半监督图节点分类方法
[0001]本专利技术属于数据挖掘领域,具体涉及一种基于个性化网页排位的半监督条件下的图节点分类方法。
技术介绍
[0002]近年来,随着信息技术的发展,大量的数据、信息不断的涌入到人们的学习、生活中。很多数据表现为像拓扑网络一样不规则的非欧几里得数据。很多人们常用的社交软件如腾讯QQ、微信、微博等都是非欧几里得数据应用领域的代表。这些软件产生的海量非结构化数据具有一定的拓扑结构,有节点和边组成,即我们常说的图。图与我们的生活息息相关,在很多领域都有实际的作用,其中一个重要的研究热点就是图节点分类问题。在一个图上,它的节点分为标签节点和无标签节点,通过将标签节点的信息传播到未标签的节点上,从而预测出未标签节点的类别,这就是节点分类过程。图节点分类问题在现实生活有着很多应用,如引文网络中的网页分类、社交网络中的社区成员识别、万维网中的页面推荐、蛋白质关系网络中的蛋白质预测等。当前解决图节点分类问题的常用方法是图神经网络,其中包含了图卷积网络、图注意力网络等在此基础上延伸出来的一些其 ...
【技术保护点】
【技术特征摘要】
1.一种基于个性化网页排位的半监督图节点分类方法,其特征在于,具体包括如下步骤:步骤1:对于给定的图,通过个性化网页排位算法计算得到图中节点的个性化网页排位值,从而得到各个标签对应的排序分布向量,根据排序分布向量得到节点的依赖向量,对依赖向量进行正则化后得到依赖关系矩阵;步骤2、通过对图神经网络进行多层隐藏层堆叠计算得到输出的隐藏层矩阵,其中每一层隐藏层包含节点的表征学习的传播和输出两部分;步骤3、将步骤1得到的依赖关系矩阵加入到通过步骤2得到的图神经网络的最后一层隐藏层矩阵中,得到新的全局隐藏矩阵H,则此时图神经网络的隐藏层矩阵变为H,进而图神经网络转变为新的图神经网络;步骤4、使用新的图神经网络的softmax层进行节点分类。2.如权利要求1所述的基于个性化网页排位的半监督图节点分类方法,其特征在于,所述步骤1具体包括如下子步骤:步骤11,给定义一个图G=(V,E),其中,定义V是n个节点的集合,n=|V|,E是m条边的集合,E={(i,j)|i∈V,j∈V};V
L
是训练集节点集合,Y
L
是训练集节点的标签集合,C表示G中包含的类别数目即不同标签的个数,C={0,1,2
…
C
‑
1};步骤12,遍历训练集节点集合V
L
和训练集节点的标签集合Y
L
,依次获得训练集中标签为c的节点集合V
c
;且c∈{0,1,2,
…
,C
‑
1},其中,Y
c
表示所有节点的标签均为c的标签集合;X为G的特征矩阵k为节点集合V中每个节点的特征向量的维数;步骤13,构造用于计算节点的个性化网页排位值PR(i,V
c
)的式(1):其中,PR(i,V
c
)表示V中节点i的个性化网页排位值;λ表示衰减因子,取0.85;|V
c
|表示训练集中标签为c的节点集V
c
中节点的数目;In(i)表示指向节点i的邻接节点集合;节点j∈In(i)是i的邻接节点;|Out(j)|表示由节点j引出的边的数量;PR(j,V
c
)表示i的邻接节点j的个性化网页排位值,式1中,初始的a+b表示节点i的度,其值等于节点i的出度a加入度b;步骤14,将步骤12得到的集合V
c
整体作为式1的输入,通过式1计算得到V中节点i的个性化网页排位值;接着将计算得到的n个节点的个性化网页排位值构成排序分布向量由式2表示:步骤15,重复步骤14得到C个排序分布向量接着依次从C个排序分布向量中提取节点i对应的C个个性化网页排位值,提取过程用表示,其中函数表示获得节点i在类目为c时排序分布向量中的个性化网页排位值PR(i,V
c
),组成节点i的依赖向量
d
i
,由式3表示:其中,表示节点i在排序分布向量中的个性化网页排位值;步骤16,对节点i的依赖向量d
i
进行正则化得到R_d
i
;步骤17,计算依赖关系矩阵D,D={R_d0,R_d1,
…
,R_d
n
‑1},3.如权利要求1所述的基于个性化网页排位的半监督图节点分类方法,其特征在于,所述步骤16的具体操作如下:利用式4对节点i的依赖向量d
i
的C个个...
【专利技术属性】
技术研发人员:梁春泉,赵航,陈航,王紫,
申请(专利权)人:西北农林科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。