【技术实现步骤摘要】
基于三元闭包图嵌入的社交网络链路预测方法及系统
[0001]本专利技术属于社交网络分析
,尤其涉及一种基于三元闭包图 嵌入的社交网络链路预测方法及系统。
技术介绍
[0002]链接预测是指对丢失的链接或未来可能发生的链接进行预测的任务。 这一任务在多个应用领域中都有着非常重要的应用,包括自动超链接创 建、网站超链接预测、推荐系统和社区检测;例如计算社交网络中两个 用户成为好友的可能性,为用户推荐与其成为好友可能性高的用户,即 两个用户间的链接预测。
[0003]现有技术中的链接预测方法,主要可以分为三类:基于相似性、基 于概率和基于嵌入的预测方法。
[0004]相似性的方法通过几种相似性度量方法来提取两个节点之间的相似 性,然后,将所有节点对根据它们的相似性来进行排序,找到其中相似 度最大的节点对,假定它们之间存在链路。基于相似性的方法受到相似 特征的限制,导致最终的预测结果准确性不高;基于概率的算法是建立 含有可调参数的模型,通过优化参数来模拟真实网络的特征和拓扑结构; 除了结构信息,基于概率的方法通常需要更多信息,例如节点或边的属 性信息;提取这些额外的属性信息既复杂又耗时,并且会导致维度爆炸。 因此,这些模型不适用于大型网络。
[0005]针对上述问题,提出了网络嵌入这一降维技术,通过将图的高维节 点映射到低维向量空间来保留节点的邻域结构。图卷积网络(GCN)在 图上定义了一个卷积算子,并迭代地聚合一个节点的采样节点的嵌入以 获得它的新嵌入;但是,其所有节点的汇聚权重相同,忽视了节 ...
【技术保护点】
【技术特征摘要】
1.一种基于三元闭包图嵌入的社交网络链路预测方法,其特征在于,包括以下步骤:对于给定的社交网络,根据采样节点的三元闭包结构,计算每个节点的节点嵌入;其中,所述采样节点包括该节点及其邻居节点;在社交网络中任取两个节点作为待预测节点,根据每个所述待预测节点的三元闭包采样节点数,计算所述两个待预测节点的拼接权重;根据所述拼接权重和节点嵌入,得到所述两个待预测节点间生成的边嵌入;利用全连接神经网络将边嵌入转化为二分类任务,根据二分类任务结果预测任意两个节点之间是否存在链接。2.根据权利要求1所述的链路预测方法,其特征在于,所述根据采样节点的三元闭包结构,计算每个节点的节点嵌入,包括:对于给定的社交网络中的每个节点,利用三元闭包结构将其对应的采样节点分为三元闭包节点和非三元闭包节点两种类型;为每种类型的节点分配不同的聚合权重;根据每个节点及其所有邻居节点的聚合权重,计算每个节点的初始节点嵌入表示;将每个节点的所述初始节点嵌入表示输入多通道单层神经网络,完成节点嵌入的特征映射,得到网络中所有节点的节点嵌入。3.根据权利要求2所述的链路预测方法,其特征在于,所述为每种类型的节点分配不同的聚合权重包括:三元闭包节点的聚合权重为1;非三元闭包节点的聚合权重为其中,N表示所述采样节点中的节点数量,l表示所述采样节点中三元闭包节点数。4.根据权利要求2或3所述的链路预测方法,其特征在于,根据下述公式计算网络中每个节点的节点嵌入:其中,G表示社交网络中所有节点集合,T表示所述采样节点中三元闭包节点集合,N表示所述采样节点中的节点数量,l
i
表示节点i的采样节点中三元闭包节点数。5.根据权利要求1所述的链路预测方法,其特征在于,利用下述公式计算两个节点的拼接权重,L
i
,L
j
为节点i,j的拼接权重;l
i
,l
j
为节点i,j的采样节点中三元闭包节点数。6.根据权利要求1所述的链路预测方法,其特征在于,利用下述公式计算两个节点间生成的边嵌入:e
ij
=L
i
h
i
+L
j
h
j
=[L
i
h
i1
+L
j
h
j1
,L
i
h
i2
+L
j
h
j2
,
…
,L
i
h
id
+L
j
h
jd
]其中,e
ij
表示社交网络节点i,j之间的边;h
i
,h
j
为社交网络的节点i,j的节点嵌入;L
i
,L
j
...
【专利技术属性】
技术研发人员:芮晓彬,王志晓,柴雅慧,张健,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。