一种基于随机游走度惩罚机制的社交网络好友预测方法技术

技术编号:26846586 阅读:26 留言:0更新日期:2020-12-25 13:10
一种基于随机游走度惩罚机制的社交网络好友预测方法,基于社交网络用户数据构建社交网络模型,通过改变随机游走采样概率来获得游走序列,在随机游走序列中依次选取用户,作为当前用户,设定滑动窗口,从中依次选取用户,作为训练的正样本,通过函数获得负采样集合,在利用节点与负样本嵌入的当前相似度作为负采样概率指标,得到训练的负样本,使用损失函数做损失。所得到的嵌入向量做内积,即为用户之间的相似度,相似度较高的即为预测的好友。本发明专利技术考虑了用户度大小以及当前的嵌入向量表示,提高了好友预测的准确性。

【技术实现步骤摘要】
一种基于随机游走度惩罚机制的社交网络好友预测方法
本专利技术涉及社交网络预测领域,特别是指一种基于随机游走度惩罚机制的社交网络好友预测方法。
技术介绍
由于网络技术的飞速发展,如今,互联网早已惠及人们生活、工作、学习等各个方面。线上社交逐渐变得不可忽视,在社会交流中占据了较大的比重。网络中的用户以及用户之间的联系形成了庞大的社交网络。为用户推荐可能认识的好友或潜在的相似好友,对于补全社交网络以及促进用户交流,具有非常大的实际价值和研究价值。网络表征学习旨在将离散数据映射为连续低维向量表征。作为一种无监督的网络学习算法,十分适合社交网络数据。表征学习所得到的用户低维向量具有一定的意义:向量的每一维数字表示都隐藏着该用户的一些特征信息,向量之间的相似性比较也可以很好地反映用户之间的相似度,为用户推荐提供了依据。因此,将社交网络的结构信息,嵌入到低维空间向量能很好地对用户关系进行存储和分析。然而,如何学习得到可信赖的,表达能力强的用户向量表征仍是一个难点问题。主流的网络表征方法存在内存占用较大或时间复杂度较高的问题。
技术实现思路
为了克服传统的社交网络方法预测好友精确度不高的问题,本专利技术提出一种通过提升用户向量表征来提高好友预测性能的基于随机游走度惩罚机制的社交网络好友预测方法,考虑了用户度大小对随机游走的影响,实现自适应的负采样,使用浅层网络,提出了一种基于度惩罚随机游走的社交网络好友预测方法,有效的提升了用户向量的表示性能,提升了社交网络好友预测的准确度。本专利技术解决其技术问题所采用的技术方案是:一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,得到随机游走节点序列步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;步骤四:计算负样本的采样概率其中负采样集合Nneg为不在随机游走序列L下的节点集合,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;步骤五:计算损失函数其中uk表示训练节点k的嵌入向量表示,up表示k的正样本,uw表示k的负样本,σ表示sigmoid函数;步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应用户对即为预测的好友,B≤Y,其中Y表示网络中无连边节点对的数量。本专利技术的技术构思为:利用大度惩罚,能够提高低度节点被游走到的概率,同时通过节点相似性自适应选取负样本,提高了社交网络好友预测的准确性。本专利技术的有益效果为:考虑了用户度大小以及当前的嵌入向量表示,使得最终好友预测结果准确率较高,拥有较强的性能。附图说明图1为模型训练示意图,L为某次考虑度惩罚下的随机游走序列,设定滑动窗口大小为2,节点4为当前用户,则节点2、3、5、6为滑动窗口内的其余用户,即正样本集,Nneg中的用户为处理过的可选取的负样本集。具体实施方式下面结合附图对本专利技术做进一步说明。参照图1,一种基于随机游走度惩罚机制的社交网络好友预测方法,包括如下步骤:步骤一:根据社交网络用户数据建立社交网络G=(V,E),如图1中的网络所示,其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,以图1为例,得到随机游走节点序列步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k的正样本,其中s为可调参数,按照此方法得到L中每个节点的正样本;步骤四:计算负样本的采样概率其中负采样集合Nneg为不在随机游走序列L下的节点集合,如图1所示,u为节点的嵌入向量表示,通过pij从Nneg中采集节点,作为训练节点k的负样本;步骤五:计算损失函数其中uk表示训练节点k的嵌入向量表示,up表示k的正样本,uw表示k的负样本,σ表示sigmoid函数;步骤六:重复步骤二到步骤五,直到损失函数收敛则算法中止,得到所有节点的嵌入向量u,针对任意无连边节点对,计算相应的嵌入向量内积,按照降序排列,取前B个内积最大节点对,所对应的用户对即为相互推荐的好友,B≤Y,其中Y表示网络中无连边节点对的数量。如上所述,本专利实施的具体实现步骤使本专利技术更加清晰。在本专利技术的精神和权利要求的保护范围内,对本专利技术作出的任何修改和改变,都落入本专利技术的保护范围。本文档来自技高网...

【技术保护点】
1.一种基于随机游走度惩罚机制的社交网络好友预测方法,其特征在于:包括如下步骤:/n步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v

【技术特征摘要】
1.一种基于随机游走度惩罚机制的社交网络好友预测方法,其特征在于:包括如下步骤:
步骤一:根据社交网络用户数据建立社交网络G=(V,E),其中,V={v1,v2,...vN}表示节点集合,每个节点表示一个用户,E为连边集合,N表示用户数,di表示节点i的度,即用户i直接相连的好友数;
步骤二:任选一个节点vi,计算vi随机游走到任意邻居节点vj的概率



其中,λ是一个可调参数,Γi表示节点i的邻居节点集合。从节点vi出发,按概率Pwalk随机游走R步,得到随机游走节点序列
步骤三:在随机游走节点序列L中每次选取1个节点,作为训练节点k,取节点k在随机游走序列L中至多前s个与后s个节点,作为训练节点k...

【专利技术属性】
技术研发人员:杨旭华马钢峰许营坤叶蕾
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1