The invention discloses a method and device for predicting network link, the method includes: using probability distribution calculated the edge probability and non existence edge distribution, re adjust the similarity values corresponding to each edge of the training set, thus taking into account the similarity of non existence of the corresponding edge, then according to the similarity adjustment after predicting possible, there can not only predict the two node high similarity between the edge, it can also be predicted two node similarity between the lower edge, and then improve the accuracy of link prediction.
【技术实现步骤摘要】
网络链路预测方法及装置
本专利技术属于数据挖掘领域,尤其涉及一种网络链路预测方法及装置。
技术介绍
网络中的链路预测(LinkPrediction)是指通过获取的已知网络节点和网络拓扑结构,预测网络中尚未产生连边的两个节点之间的链接的可能性。链路预测包括未知链接(existyetunknownlinks)的预测以及未来链接(futurelinks)的预测。传统的链路预测方法有多种,一般使用相似度算法对网络链路进行预测。基于相似度算法的链路预测包括:共同邻居(CN,Commonneighbor)算法、杰卡德系数(Jaccarbcoefficient)算法、资源分配(RA,Resourceallocation)算法、局部路径指标(LP,Localpath)算法以及结构微扰法(SPM,StructuralPerturbationMethod)。上述的相似度算法,均是计算两个节点间的相似度得到相似度值,并将相似度值高的边,即相似度高的边,作为预测存在的边。但是在复杂网络中,相较于相似性大的边,一些相似性低的两个节点所形成的边能够有着更稳定的链接。通过现有的相似度算法只能算 ...
【技术保护点】
一种网络链路预测方法,其特征在于,包括:获取网络的网络拓扑结构;将所述网络拓扑结构中各节点间所形成的边,划分为存在的边和非存在的边,并从所述存在的边中选取多个边组成训练集;计算所述训练集中每一条存在的边的两个节点的相似度,得到所述训练集中各存在的边对应的相似度值,以及计算每一条所述非存在的边的两个节点的相似度,得到各非存在的边的对应的相似度值;将经过相似度计算的各边划分为多个集合,并分别对各集合内存在的边和非存在的边的数量进行概率统计,得到各集合中存在的边的概率分布和非存在的边的概率分布;根据预置转换函数、所述存在的边的概率分布和所述非存在的边的概率分布,对得到的所述各存在 ...
【技术特征摘要】
1.一种网络链路预测方法,其特征在于,包括:获取网络的网络拓扑结构;将所述网络拓扑结构中各节点间所形成的边,划分为存在的边和非存在的边,并从所述存在的边中选取多个边组成训练集;计算所述训练集中每一条存在的边的两个节点的相似度,得到所述训练集中各存在的边对应的相似度值,以及计算每一条所述非存在的边的两个节点的相似度,得到各非存在的边的对应的相似度值;将经过相似度计算的各边划分为多个集合,并分别对各集合内存在的边和非存在的边的数量进行概率统计,得到各集合中存在的边的概率分布和非存在的边的概率分布;根据预置转换函数、所述存在的边的概率分布和所述非存在的边的概率分布,对得到的所述各存在的边对应的相似度值进行调整;在调整后的相似度值中,选取大于或等于预置数值的相似度值,并将选取的相似度值对应的存在的边,作为所述网络拓扑结构中预测的边。2.根据权利要求1所述的方法,其特征在于,所述将所述网络拓扑结构中各节点间所形成的边,划分为存在的边和非存在的边,并从所述存在的边中选取多个边组成训练集包括:设置所述网络拓扑结构的邻接矩阵A=(aij)N×N,其中aij表示节点i和节点j间边的权重值,N为所述网络拓扑结构中节点的数量,并将aij=1的边作为所述存在的边,以及将aij=0的边作为所述非存在的边,节点i和节点j属于所述网络拓扑结构中的节点;从所述存在的边中选取多个边组成训练集ET,其中,E={(i,j)|aij≠0}。则所述从所述存在的边中选取多个边组成训练集之后还包括:在所述网络拓扑结构中,选取所述训练集中的边之外的存在的边组成测试集EP,其中ET∪EP=E。3.根据权利要求2所述的方法,其特征在于,所述将经过相似度计算的各边划分为多个集合包括:将得到的相似度值划分为多个组,并将每一组中的相似度值对应的边划分为一个集合。4.根据权利要求3所述的方法,其特征在于,所述根据预置转换函数、所述存在的边的概率分布和所述非存在的边的概率分布,对得到的所述各存在的边对应的相似度值进行调整,包括:根据预置转换函数分别计算各集合中存在的边的概率分布和非存在的边的概率分布之间的比值,其中,所述预置转换函数为:pr(s)为存在的边的概率分布,pn(s)为非存在的边的概率分布,s为划分的组中包含的相似度值;将各集合算出的比值PNR(s)分别作为各集合中存在的边对应的调整后的相似度值。5.根据权利要求4所述的方法,其特征在于,所述在调整后的相似度值中,选取大于或等于预置数值的相似度值,并将选取的相似度值对应的存在的边,作为所述网络拓扑结构中预测的边,之后还包括:根据选取的预测的边对应的调整后的相似度值,计算网络链路预测的准确率,得到准确率pF;计算网络链路预测的准确率的公式为:其中,α是一个常数,|EP|为所述测试集中边的集合,|U-ET|为所述非存在的边和所述测试...
【专利技术属性】
技术研发人员:周明洋,熊文漫,廖好,沈婧,吴向阳,陆克中,毛睿,
申请(专利权)人:深圳大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。