一种基于MPA模型的消失链路预测方法技术

技术编号:20164500 阅读:31 留言:0更新日期:2019-01-19 00:17
本发明专利技术公开了一种基于MPA模型的消失链路预测方法,在科学合作网络中定义了消失的链路预测,并在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路的权重对消失链路预测的负面影响,从而更快速准确的预测消失的链路。这为深入探究网络结构的动态演化规律和机制等网络科学问题提供新思路。本发明专利技术预测方法在AUC和精确率上较七种经典结构相似性算法具有较大的优势,它能够在消失链路预测问题中获得更精确的预测效果。

【技术实现步骤摘要】
一种基于MPA模型的消失链路预测方法
本专利技术涉及一种基于MPA模型的消失链路预测方法,属于计算机图挖掘

技术介绍
随着网络科学的快速发展,使得链路预测的研究与网络的结构与演化紧密联系起来。链路预测成为研究复杂网络的重要方法。有许多用于链接预测的方法,如基于相似性的方法。基于相似性算法的研究是主流问题。基于相似性的方法是通过各种相似性方法如:节点相似性方法来计算节点对之间的相似性,并提供有序列表来预测两个节点之间链接的可能性。通常,节点相似性方法是利用节点的属性和特征来描述节点。但节点的基本属性通常是隐藏的并且很难获得。另一种称为结构相似性指标可计算两节点的相似程度。经典的基于结构相似性的链路预测有PreferentialAttachmentindex(PAindex)等。链路的形成和消失是网络组织中链路动态的基本过程。目前大多数链路预测工作都侧重于链路的形成。然而,很少有人研究消失的链路预测问题。且现有的研究只停留在发现和分析链接消失的原因上。更少有研究人员试图从网络科学中链接消失的角度来分析。鉴于此,本专利技术提出一种基于MPA模型的消失链路预测方法。
技术实现思路
本专利技术的目的主要针对上述问题,在科学合作网络中定义了消失链路预测,并在PA指标的基础上考虑节点对的邻居链路的不同作用和链路的权重,设计出一种称为ModifiedPreferentialAttachment(MPA)的模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。为深入地理解复杂网络演化的机制提供新思路。本专利技术的技术方案:一种基于MPA模型的消失链路预测方法,步骤如下:(1)利用DBLP数据集构建无向科学合作网络,并提取科学合作网络的最大连通子图(MCS);(2)在科学合作网络中给定消失链路预测的定义;(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据。计算每年消失链路数比率;(4)根据消失链路比率由逐年减小至基本保持不变,可得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED;(5)基于链路预测中PA指标,设计出新的基于结构相似性的MPA模型计算两个目标节点之间的相似性;(6)根据MPA模型的值的大小对当前网络所有节点对进行由小到大排序;(7)根据排在前面的链路在未来消失的可能性越大,因此将这些链路作为预测得到的未来可能会消失的链路;(8)根据AUC和精确度评估指标来衡量预测算法MPA的精确度,并与七种经典的基于结构相似性指标进行预测效果对比。进一步地,所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表作者,边表示合作关系;所述的消失链路预测是指,在时间间隔[t0,t](t0<t)的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′(t′>0)都是断开的,称这条链路xy为消失的链路,那些短暂消失后又重新产生连接的链路不是本专利所指的消失的链路;所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;所述的PA指标是指,新链接产生于节点x和y之间的可能性正比于这两个节点的度的乘积,PA指标的计算如下:Sxy=SxxSy=∑i∈τ(x)Wixx∑j∈τ(y)Wjy其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;所述的MPA模型是指,在PA指标的基础上考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:1)L1:节点x和节点y直接相连的链接;2)L2:节点x(或节点y)与它和节点y(或节点x)的共同邻居节点之间的链接;3)L3:除上述两种链接之外的与目标节点相连的链接。分别为L1,L2,L3添加一个参数用于控制不同类型链接在链接消失中的作用,并改写SX、Sy的计算公式:Sx=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑j∈{τ(x)-τ(x)∩τ(y)-y}WjxSy=λL1+μL2+νL3=λWxy+μ∑i∈τ(x)∩τ(y)Wix+ν∑k∈{τ(x)-τ(x)∩τ(y)-y}Wkx其中,λ、μ、ν的取值为0或1,用于区分L1、L2、L3在消失链路预测中是否有贡献,根据L1,L2,L3七种组合方式下PA相似性的精确度,得出节点与共同邻居相连的链路在消失链路预测时具有消极影响,使用其倒数函数来削弱消除公共邻居链路L2的影响,设计出MPA模型;MPA模型的值的大小的计算如下:其中,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示权重。所述的AUC是指,是从整体上衡量算法的精确性,在消失链路预测中可以理解为将消失链接集合ED中随机选择的一条链接与存在链接集合ER中随机选择的一条链接进行比较,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数,则加1分;如果两个分数值相等,则加0.5分。独立比较m次中,如果消失链接集合中的链接的分数小于存在链接集合中链接的分数的次数为m`次,两分数值相等为m``次,则消失链路预测中AUC评估指标可以定义为:所述的精确度是指,前L条预测边中被预测准确的链接所占的比例,即排在前L的链接中Ld条链接在消失链接集合中;精确度的计算为:所述的经典的基于结构相似性指标,包含CommonNeighbors(CN),Adamic-Adar(AA),ResourceAllocation(RA),PreferentialAttachment(PA),LocalPath(LP),Katz和RandomWalkwithRestart(RWR)。本专利技术的有益效果:本专利技术在PA指标的基础上考虑了节点对的邻居链路的不同作用和链路的权重,设计出MPA模型消除公共邻居链路对权重的负面影响,更快速准确的预测消失的链路。它从新的视角出发,为深入了解网络动态演化机制等网络科学问题提供新思路。附图说明图1为消失链路比率的示例图。图2为目标节点对的邻居链路类型示例图。具体实施方式下面结合具体实施例对本专利技术所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。一种基于MPA模型的消失链路预测方法,步骤如下:(1)建立无向科学合作网络根据1990-1992年的DBLP数据集中的节点以及边的关系,构建无向科学合作网络;(2)提取科学合作网络的最大连通子图(MCS);(3)抽取接下来20年的MCS中学者的共同作者信息。即从1993到2012年的链接是否相连的数据。计算每年消失链路数比率,20年间消失链路比率如图1所示;(4)根据从2007年开始消失链路比率几乎保持0.684不变,这就意味着MCS在15年后保持断开的链接几乎是真正意义上消失的链接。根据消失链路比率的定义得到消失链路的真实数据集ED;(5)基于链路预测中PA指标,考虑了目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,如图2所示,设计出新的基于结本文档来自技高网...

【技术保护点】
1.一种基于MPA模型的消失链路预测方法,其特征在于,步骤如下:(1)利用DBLP数据集构建无向科学合作网络,并提取无向科学合作网络的最大连通子图MCS;所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表示作者,边表示合作关系;(2)在无向科学合作网络中给定消失链路预测的定义;所述的消失链路预测是指,在时间间隔[t0,t]的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′都是断开的,称这条链路xy为消失的链路;其中,t0

【技术特征摘要】
1.一种基于MPA模型的消失链路预测方法,其特征在于,步骤如下:(1)利用DBLP数据集构建无向科学合作网络,并提取无向科学合作网络的最大连通子图MCS;所述的DBLP数据集描述的是计算机科学领域作者之间合作的关系,节点表示作者,边表示合作关系;(2)在无向科学合作网络中给定消失链路预测的定义;所述的消失链路预测是指,在时间间隔[t0,t]的无向网络G(V,E),其中V表示节点集合,E表示边集合,在当前t时刻节点x和节点y相连形成的链接,从t+1时刻开始一直持续到未来的时刻t′都是断开的,称这条链路xy为消失的链路;其中,t0<t,t′>0;那些短暂消失后又重新产生连接的链路不是所指的消失的链路;(3)抽取接下来20年的MCS中学者的共同作者信息,即链路是否相连的数据,并计算每年消失链路数比率;所述的消失链路比率是指,每年消失链接数量占最大连通子图中链接数量的比率;(4)根据消失链路比率由逐年减小至基本保持不变,得链路比率在基本不变之后的时间中断开的链路是真正意义上消失的链路,即由消失链路比率的定义得到消失链路的真实数据集ED;(5)基于链路预测算法中PA指标,设计新的基于结构相似性的MPA模型,计算两个目标节点之间的相似性;所述的PA指标是指,两个节点x和y之间产生一条新链路的可能性正比于这两个节点的度的乘积,PA指标的加权形式计算如下:Sxy=SxxSy=∑i∈τ(x)Wixx∑j∈τ(y)Wjy其中,Sx是指节点x的度,Sy指节点y的度,τ(x)表示x的邻居节点,τ(y)表示y的邻居节点,W表示节点间的权重,Sxy表示PA指标的大小;所述的MPA模型是指,在PA指标的基础上考虑目标节点对的邻居链路类型的不同作用和链路的权重,把组成目标链路的节点对的邻居链路分为三类,包括:1)L1:节点x和节点y直接相连的链接;2)L2:节点x与它和节点y的共同邻居节点之间的链接;节点y与它和节点x的共同邻居节点之间的链接;3)L3:除上述两种链接之外的与目标节点...

【专利技术属性】
技术研发人员:徐博陈鹏刘嘉莹李璐夏锋
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1