【技术实现步骤摘要】
结合二层节点度和聚类系数的链路预测算法
本专利技术涉及链路预测领域,特别是涉及一种结合二层节点度和聚类系数的链路预测算法。
技术介绍
复杂网络可以用来表示自然界与现实世界的各种复杂系统,具有复杂性、无标度和小世界等特性。链路预测作为目前复杂网络研究中的热点问题,可以实现根据已知的节点属性、节点间的连接情况和网络拓扑结构对未知链接进行还原和预测的功能,现已成为连接复杂网络与信息科学的重要纽带。复杂网络的链路预测问题对于复杂网络的结构分析和网络发展等方面的研究具有重要意义。目前针对复杂网络中的链路预测研究已经提出了许多思想和算法,主要分为基于马尔科夫链、基于概率似然模型和基于拓扑结构三类。其中,基于马尔科夫链和基于概率似然的链路预测算法在真实网络中具有良好的预测精度,但由于计算复杂度较高,无法适用于大规模网络中。而基于网络拓扑结构的链路预测算法在保证预测精度的同时降低算法复杂度,与此同时所需的拓扑结构信息容易获取,是处理当今大数据时代各种大规模网络的最优方案。因此,基于拓扑结构的链路预测方法在复杂网络的链路预测研究中得以 ...
【技术保护点】
1.建立结合二层节点度和聚类系数的链路预测算法,其特征在于以下步骤:/n1)解决CN,AA,RA和PA算法在链路预测的相似性计算时都只考虑了共同邻居节点数目或者节点的度,而忽略了节点的聚类系数的问题。/n2)解决NDCC算法在节点度这一影响因素中只考虑了一层节点的问题。/n3)建立TDNCC算法。/n4)与六种已有链路预测算法进行对比后,其结果说明本文提出的TDNCC算法在链路预测中具有一定的可行性和有效性。/n
【技术特征摘要】
1.建立结合二层节点度和聚类系数的链路预测算法,其特征在于以下步骤:
1)解决CN,AA,RA和PA算法在链路预测的相似性计算时都只考虑了共同邻居节点数目或者节点的度,而忽略了节点的聚类系数的问题。
2)解决NDCC算法在节点度这一影响因素中只考虑了一层节点的问题。
3)建立TDNCC算法。
4)与六种已有链路预测算法进行对比后,其结果说明本文提出的TDNCC算法在链路预测中具有一定的可行性和有效性。
2.如权利要求1所述的建立结合二层节点度和聚类系数的链路预测算法,其中所述步骤1中,解决CN,AA,RA和PA算法在链路预测的相似性计算时都只考虑了共同邻居节点数目或者节点的度,而忽略了节点的聚类系数的问题的方法如下:
CN,AA,RA和PA算法在链路预测的相似性计算时都只考虑了共同邻居节点数目或者节点的度,而忽略了节点的聚类系数。事实上,节点的聚类系数也会对节点间的连边产生影响。如图1所示,被预测节点对(x,y)拥有相同的共同邻居节点A和H,根据CN,AA,RA和PA这四种算法对节点对的相似性进行计算,结果显示节点对(x,y)的相似性相同。然而,图1(b)中节点对(x,y)的共同邻居节点的聚类系数明显大于图1(a)中节点对(x,y)的共同邻居节点的聚类系数。基于上述观点可以得出结论,图1(b)中节点对(x,y)要比图1(a)中节点对(x,y)有更大的连接可能性。
3.如权利要求1所述的建立结合二层节点度和聚类系数的链路预测算法,其中所述步骤2中,解决NDCC算法在节点度这一影响因素中只考虑了一层节点的问题的方法如下:
NDCC链路预测算法将节点度和聚类系数结合有效的解决了图1中存在的问题。然而,在节点度这一影响因素中NDCC方法只考虑了一层节点。
如图2所示,被预测节点对(x,y)中x的二层邻接节点K与节点y相连;y的二层邻接节点L与节点x相连。根据NDCC链路预测算法对节点对的相似性进行计算,结果显示节点对(x,y)的相似性相同。然而,图2(b)中节点对(x,y)的二层共同邻居节点的个数明显大于图2(a)中节点对(x,y)的二层共同邻居节点的个数。基于上述观点可以得出结论,图2(b)中节点对(x,y)要比图2(a)中节点对(x,y)有更大的连接可能性。
4.如权利要求1所述的建立结合二层节点度和聚类系数的链路预测算法,其中所述步骤3中,建立TDNCC算法的方法如下:
本文在相似性指标的定义上首先考虑图1中聚类系数对节点对连接概率的影响,认为聚类系数大的节点对拥有高相似性,故将聚类系数Cz添加到Sxy中;其次,考虑图2中二层邻接节点数量对节点对连接概率的影响,认为在单层节点度相同时,二层节点度大的节点对拥有高相似性,故将二层节点度ki添加到Sxy中。提出了结合二层节点度和聚类系数的链路预测算...
【专利技术属性】
技术研发人员:张月霞,陈紫扬,
申请(专利权)人:北京信息科技大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。