基于三元闭包图嵌入的社交网络链路预测方法及系统技术方案

技术编号:33559765 阅读:25 留言:0更新日期:2022-05-26 22:56
本发明专利技术提供一种基于三元闭包图嵌入的社交网络链路预测方法及系统,该方法包括:对于给定的社交网络,根据采样节点的三元闭包结构,计算每个节点的节点嵌入;在社交网络中任取两个节点作为待预测节点,根据每个所述待预测节点的三元闭包采样节点数,计算所述两个待预测节点的拼接权重;根据所述拼接权重和节点嵌入,得到所述两个待预测节点间生成的边嵌入;利用全连接神经网络将边嵌入转化为二分类任务,根据二分类任务结果预测任意两个节点之间是否存在链接。本发明专利技术充分利用社交网络中节点的结构信息,并考虑节点邻居之间的差异性,采用深度神经网络确保社交网络链路预测的准确性。确性。确性。

【技术实现步骤摘要】
基于三元闭包图嵌入的社交网络链路预测方法及系统


[0001]本专利技术属于社交网络分析
,尤其涉及一种基于三元闭包图 嵌入的社交网络链路预测方法及系统。

技术介绍

[0002]链接预测是指对丢失的链接或未来可能发生的链接进行预测的任务。 这一任务在多个应用领域中都有着非常重要的应用,包括自动超链接创 建、网站超链接预测、推荐系统和社区检测;例如计算社交网络中两个 用户成为好友的可能性,为用户推荐与其成为好友可能性高的用户,即 两个用户间的链接预测。
[0003]现有技术中的链接预测方法,主要可以分为三类:基于相似性、基 于概率和基于嵌入的预测方法。
[0004]相似性的方法通过几种相似性度量方法来提取两个节点之间的相似 性,然后,将所有节点对根据它们的相似性来进行排序,找到其中相似 度最大的节点对,假定它们之间存在链路。基于相似性的方法受到相似 特征的限制,导致最终的预测结果准确性不高;基于概率的算法是建立 含有可调参数的模型,通过优化参数来模拟真实网络的特征和拓扑结构; 除了结构信息,基于概率的方法通常需要更多信息,例如节点或边的属 性信息;提取这些额外的属性信息既复杂又耗时,并且会导致维度爆炸。 因此,这些模型不适用于大型网络。
[0005]针对上述问题,提出了网络嵌入这一降维技术,通过将图的高维节 点映射到低维向量空间来保留节点的邻域结构。图卷积网络(GCN)在 图上定义了一个卷积算子,并迭代地聚合一个节点的采样节点的嵌入以 获得它的新嵌入;但是,其所有节点的汇聚权重相同,忽视了节点间的 结构差异。GraphSAGE通过均匀采样得到一个固定大小的邻居集,然后 通过特征聚合生成节点嵌入;但是,抛弃部分节点会造成信息丢失,尤 其是在度值较小的网络上,会造成更严重的信息丢失;CensNet通过使用 原始无向图的线图将节点和边共同嵌入到潜在特征空间;这些基于边缘 的方法对于图嵌入是有效的,但是,由于边的数量通常远大于网络中节 点的数量,直接嵌入边需要花费更多的时间,这使得链路预测效率低下。
[0006]由两个节点嵌入生成边嵌入时,现有方法主要包括Hadamard乘积、 求和或直接连接。这些方法将两个节点视为等价的节点,没有考虑它们 对边形成的不同贡献。因此,会导致局部结构信息的丢失,影响链路预 测的性能。
[0007]综上所述,现有基于嵌入的社交网络链路预测方法存在以下不足: (1)传统方法在获取节点嵌入时,需要为每个节点分配完全不同的权重, 或在聚合过程中对所有邻居共享完全相同的权重,不能以较低的节点聚 合成本很好地保留全局结构信息;(2)当从两个节点嵌入生成边嵌入时, 现有方法将两个节点等效看待,而不考虑它们对边形成的不同贡献,会 导致局部结构信息的丢失,影响链路预测的性能。

技术实现思路

[0008]鉴于上述的分析,本专利技术旨在提供一种基于三元闭包及其图嵌入的 社交网络链路预测方法及系统,用于解决现有技术中基于图嵌入的方法 无法保留网络中节点的全局结构信息,会导致局部结构信息丢失的问题。
[0009]本专利技术的目的主要是通过以下技术方案实现的:
[0010]一方面,本专利技术提供一种基于三元闭包图嵌入的社交网络链路预测 方法,其特征在于,包括以下步骤:
[0011]对于给定的社交网络,根据采样节点的三元闭包结构,计算每个节 点的节点嵌入;其中,所述采样节点包括该节点及其邻居节点;
[0012]在社交网络中任取两个节点作为待预测节点,根据每个所述待预测 节点的三元闭包采样节点数,计算所述两个待预测节点的拼接权重;
[0013]根据所述拼接权重和节点嵌入,得到所述两个待预测节点间生成的 边嵌入;
[0014]利用全连接神经网络将边嵌入转化为二分类任务,根据二分类任务 结果预测任意两个节点之间是否存在链接。
[0015]进一步的,所述根据采样节点的三元闭包结构,计算每个节点的节 点嵌入,包括:
[0016]对于给定的社交网络中的每个节点,利用三元闭包结构将其对应的 采样节点分为三元闭包节点和非三元闭包节点两种类型;
[0017]为每种类型的节点分配不同的聚合权重;
[0018]根据每个节点及其所有邻居节点的聚合权重,计算每个节点的初始 节点嵌入表示;
[0019]将每个节点的所述初始节点嵌入表示输入多通道单层神经网络,完 成节点嵌入的特征映射,得到网络中所有节点的节点嵌入。
[0020]进一步的,前述的为每种类型的节点分配不同的聚合权重包括:
[0021]三元闭包节点的聚合权重为1;
[0022]非三元闭包节点的聚合权重为其中,N表示采样节点中的节点 数量,l表示采样节点中三元闭包节点数。
[0023]进一步的,根据下述公式计算网络中每个节点的节点嵌入:
[0024][0025]其中,G表示社交网络中所有节点集合,T表示所述采样节点中三元 闭包节点集合,N表示采样节点中的节点数量,l
i
表示节点i的采样节点 中三元闭包节点数。
[0026]进一步的,利用下述公式计算两个节点的拼接权重,
[0027][0028]L
i
,L
j
为节点i,j的拼接权重;l
i
,l
j
为节点i,j的采样节点中三元闭包节 点数。
[0029]进一步的,利用下述公式计算两个节点间生成的边嵌入:
[0030]e
ij
=L
i
h
i
+L
j
h
j
=[L
i
h
i1
+L
j
h
j1
,L
i
h
i2
+L
j
h
j2
,

,L
i
h
id
+L
j
h
jd
][0031]其中,e
ij
表示社交网络节点i,j之间的边;h
i
,h
j
为社交网络的节点i,j 的节点嵌
入;L
i
,L
j
为节点i,j在拼接时的拼接权重。
[0032]进一步的,所述根据二分类任务结果预测两个节点之间是否存在链 接,包括:
[0033]将所述边嵌入输入到全连接神经网络,将边嵌入降维成二维,得到 二维的边嵌入表示;
[0034]将二维的边嵌入表示经过softmax激活函数,得到最终的预测分数;
[0035]若预测分数大于0.5,则预测为两个节点间存在链接。
[0036]进一步的,本专利技术还涉及一种基于三元闭包图嵌入的社交网络链路预 测系统,其特征在于,包括:
[0037]节点嵌入计算模块,用于根据社交网络中的三元闭包结构计算每个 节点的节点嵌入;
[0038]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于三元闭包图嵌入的社交网络链路预测方法,其特征在于,包括以下步骤:对于给定的社交网络,根据采样节点的三元闭包结构,计算每个节点的节点嵌入;其中,所述采样节点包括该节点及其邻居节点;在社交网络中任取两个节点作为待预测节点,根据每个所述待预测节点的三元闭包采样节点数,计算所述两个待预测节点的拼接权重;根据所述拼接权重和节点嵌入,得到所述两个待预测节点间生成的边嵌入;利用全连接神经网络将边嵌入转化为二分类任务,根据二分类任务结果预测任意两个节点之间是否存在链接。2.根据权利要求1所述的链路预测方法,其特征在于,所述根据采样节点的三元闭包结构,计算每个节点的节点嵌入,包括:对于给定的社交网络中的每个节点,利用三元闭包结构将其对应的采样节点分为三元闭包节点和非三元闭包节点两种类型;为每种类型的节点分配不同的聚合权重;根据每个节点及其所有邻居节点的聚合权重,计算每个节点的初始节点嵌入表示;将每个节点的所述初始节点嵌入表示输入多通道单层神经网络,完成节点嵌入的特征映射,得到网络中所有节点的节点嵌入。3.根据权利要求2所述的链路预测方法,其特征在于,所述为每种类型的节点分配不同的聚合权重包括:三元闭包节点的聚合权重为1;非三元闭包节点的聚合权重为其中,N表示所述采样节点中的节点数量,l表示所述采样节点中三元闭包节点数。4.根据权利要求2或3所述的链路预测方法,其特征在于,根据下述公式计算网络中每个节点的节点嵌入:其中,G表示社交网络中所有节点集合,T表示所述采样节点中三元闭包节点集合,N表示所述采样节点中的节点数量,l
i
表示节点i的采样节点中三元闭包节点数。5.根据权利要求1所述的链路预测方法,其特征在于,利用下述公式计算两个节点的拼接权重,L
i
,L
j
为节点i,j的拼接权重;l
i
,l
j
为节点i,j的采样节点中三元闭包节点数。6.根据权利要求1所述的链路预测方法,其特征在于,利用下述公式计算两个节点间生成的边嵌入:e
ij
=L
i
h
i
+L
j
h
j
=[L
i
h
i1
+L
j
h
j1
,L
i
h
i2
+L
j
h
j2
,

,L
i
h
id
+L
j
h
jd
]其中,e
ij
表示社交网络节点i,j之间的边;h
i
,h
j
为社交网络的节点i,j的节点嵌入;L
i
,L
j
...

【专利技术属性】
技术研发人员:芮晓彬王志晓柴雅慧张健
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1