基于改进的图卷积网络的博客用户划分方法技术

技术编号:33784571 阅读:17 留言:0更新日期:2022-06-12 14:39
本发明专利技术涉及一种基于改进的图卷积网络的博客用户划分方法,包括以下步骤:步骤S1:构建博客用户信息的节点图;步骤S2:将边预测概率模型作为数据前处理嵌入GCNII模型,构建深层图卷积神经网络;步骤S3:将步骤S1构建的节点图数据预处理后,作为深层图卷积神经网络输入,获取输出结果,即为用户分类结果。本发明专利技术通过加深网络层次来提升学习精度,提升博客用户“社区”划分的准确性。划分的准确性。划分的准确性。

【技术实现步骤摘要】
基于改进的图卷积网络的博客用户划分方法


[0001]本专利技术涉及深度学习领域,具体涉及一种基于改进的图卷积网络的博客用户划分方法。

技术介绍

[0002]随着互联网的普及,网络几乎成为了人们搜集信息和交流沟通最方便最快捷的通道,网络同时也给了人们充分表达自我的舞台。伴随着网络发展而诞生的博客,其推广与使用促进了人类的交流与知识的传播。活动推送,内容推广等需要根据用户群体的不同而变化,所以为庞大的博客用户划分不同的“社区”是必不可少的。深度学习在视觉识别、语音识别和自然语言处理等应用领域上已经获得极大地的成功,如卷积神经网络CNNs(CNNs:Convolutional Neural Networks)具有平移不变性、局部性等特点,在处理音频、图像等欧式结构数据上形成了天然的优势。然而,CNNS无法处理博客用户信息抽象成的非欧式图结构数据。
[0003]近年图卷积网络(GCNs:Graph Convolutional Networks)成为新的研究热点,它的目标是希望借鉴CNNs的应用架构来实现图(Graph)结构数据的智能学习。图本身是典型的非欧式数据结构,传统的CNNs的一些基本数学运算很多是基于欧式空间进行推演的,不能直接推广到图数据的学习中,所以图神经网络的研究需要新的数学手段和方法来支撑。当然,图的表达能力很强,可以更好地刻画现实世界的复杂问题,如社交网、交通网、推荐系统等都可以抽象成图结构数据。因此,图神经网络技术有着广泛的应用前景。
[0004]图卷积网络近年获得极大的成功,涌现了许多模型。然而,比较成功的GCNs基本都是浅层结构,即在2~4层就几乎收敛到某个固定状态。这种现象被称为过平滑(Over smooth)。过平滑是图神经网络中特有的问题。由于GCNs在评估一个节点时不仅要考虑节点本身的特征信息,而且还聚合了邻居节点的特征信息,加快了局部收敛速度,这是GCNs在构架上容易形成过平滑的主要原因,也是构建深层GCNs的主要性能瓶颈所在。过平滑的直接后果就是学习快而精细度差。因为卷积网络很快收敛,浅层网络下梯度就可能消失,图中节点的高阶邻居信息等无法通过加深网络层次来提升学习精度。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于改进的图卷积网络的博客用户划分方法,通过加深网络层次来提升学习精度,提升博客用户“社区”划分的准确性。
[0006]为实现上述目的,本专利技术采用如下技术方案:
[0007]一种基于改进的图卷积网络的博客用户划分方法,包括以下步骤:
[0008]步骤S1:构建博客用户信息的节点图;
[0009]步骤S2:将边预测概率模型作为数据前处理嵌入GCNII模型,构建深层图卷积神经网络;
[0010]步骤S3:将步骤S1构建的节点图数据预处理后,作为深层图卷积神经网络输入,获
取输出结果,即为用户分类结果。
[0011]进一步的,所述节点图以用户作为节点,用户所阅读的博客文章标签类型作为节点特征,用户之间的关注和被关注信息作为图的边。
[0012]进一步的,所述边预测概率模型包括两层GCN网络,具体的:
[0013]给定一个图Ga的邻接矩阵A,设节点特征维度是d,节点特征矩阵为X∈R
N
×
d
;设编码后数据维度为p<<d,则:
[0014][0015]编码后数据再经过一个内积解码器,得到边概率矩阵M:
[0016]M=sigmoid(ZZ
T
),M∈R
N
×
N
ꢀꢀꢀꢀꢀꢀ
(2)。
[0017]进一步的,所述预处理,具体为:对于图G,设ε为图G的边个数,a,r∈[0,1],根据边概率矩阵M,选择添加图G中不存在的,aε条概率最高的边,删除图G中存在的,rε条概率最低的边,修改后并归一化的邻接矩阵为
[0018]进一步的,所述GCNII引入残差连接和恒等映射技术,构建深层图网络模型,GCNII的图卷积公式为:
[0019]H
(l+1)
=f(H
(l)
,A)
[0020]=σ(((1

α)AH
(l)
+αH
(0
))((1

β)I+βW
l
))
ꢀꢀ
(3)
[0021]其中H
(l)
为l层的输出向量,I是单位矩阵,α、β为超参数,σ为激活函数,W
l
为l层的权重,H
(0)
为初始残差。
[0022]本专利技术与现有技术相比具有以下有益效果:
[0023]本专利技术通过加深网络层次来提升学习精度,有效提升博客用户“社区”划分的准确性。
附图说明
[0024]图1是本专利技术一实施例中EPP

GCNII网络模型的示意图
[0025]图2是本专利技术一实施例中GCNII模型示意图。
具体实施方式
[0026]下面结合附图及实施例对本专利技术做进一步说明。
[0027]本专利技术提供一种基于改进的图卷积网络的博客用户划分方法,包括以下步骤:
[0028]步骤S1:构建博客用户信息的节点图,以用户作为节点,用户所阅读的博客文章标签类型作为节点特征,用户之间的关注和被关注信息作为图的边;
[0029]步骤S2:将边预测概率模型作为数据前处理嵌入GCNII模型,构建深层图卷积神经网络;
[0030]步骤S3:将步骤S1构建的节点图数据预处理后,作为深层图卷积神经网络输入,获取输出结果,即为用户分类结果。
[0031]在本实施例中,边预测概率模型包括两层GCN网络,具体的:
[0032]给定一个图Ga的邻接矩阵A,设节点特征维度是d,节点特征矩阵为X∈R
N
×
d
;设编码后数据维度为p<<d,则:
[0033][0034]编码后数据再经过一个内积解码器,得到边概率矩阵M:
[0035]M=sigmoid(ZZ
T
),M∈R
N
×
N
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)。
[0036]在本实施例中,参考图1,将EPP模型作为数据前处理嵌入到已有的GCNII模型中,构建深层图卷积网络;
[0037]在本实施例中,预处理,具体为:对于图G,设ε为图G的边个数,a,r∈[0,1],根据边概率矩阵M,选择添加图G中不存在的,aε条概率最高的边,删除图G中存在的,rε条概率最低的边,修改后并归一化的邻接矩阵为
[0038]算法1为GP的具体步骤。
[0039][0040]在本实施例中,图卷积神经网络(GCN)随着层数的增加会导致梯度消失问题,多次的聚合使得节点特征收敛到相同的值,最终导致节点无法区本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的图卷积网络的博客用户划分方法,其特征在于,包括以下步骤:步骤S1:构建博客用户信息的节点图;步骤S2:将边预测概率模型作为数据前处理嵌入GCNII模型,构建深层图卷积神经网络;步骤S3:将步骤S1构建的节点图数据预处理后,作为深层图卷积神经网络输入,获取输出结果,即为用户分类结果。2.根据权利要求1所述的基于改进的图卷积网络的博客用户划分方法,其特征在于,所述节点图以用户作为节点,用户所阅读的博客文章标签类型作为节点特征,用户之间的关注和被关注信息作为图的边。3.根据权利要求1所述的基于改进的图卷积网络的博客用户划分方法,其特征在于,所述边预测概率模型包括两层GCN网络,具体的:给定一个图Ga的邻接矩阵A,设节点特征维度是d,节点特征矩阵为X∈R
N
×
d
;设编码后数据维度为p<<d,则:编码后数据再经过一个内积解码器,得到边概率矩阵M:M=sigmoid(ZZ
T
),M∈R
N
×
N
ꢀꢀꢀꢀꢀꢀꢀꢀ
(2)...

【专利技术属性】
技术研发人员:毛国君陈林凯熊保平
申请(专利权)人:福建工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1