The invention discloses a directed network link prediction method for integrating multi-mode body information, which is characterized by the following steps: S1. Constructing an initial network and obtaining a list of node pairs without connecting edges; S2. Randomly selecting 10% of the connecting edges in the initial network data as positive samples of the test set, 90% of the remaining connecting edges as training sets, and selecting large connecting edge sets such as positive samples of the test set The cooperation is the negative sample of the test set; S3. Get the role function value of the individual in the initial network; S4. Get the role function r of each node to the corresponding common neighbor
【技术实现步骤摘要】
一种融合多模体信息的有向网络链路预测方法
本专利技术涉及一种链路预测方法,具体说是一种融合多模体信息的有向网络链路预测方法。
技术介绍
链路预测是复杂网络领域一个重要的研究方向,所要处理的基本问题就是通过已知的网络节点以及网络结构等信息,预测网络中任意两个节点之间存在链接的可能性。通过链路预测不仅可以得到网络中不存在的边未来可能存在的可能性,也可以查找出网络中已存在的连边是否是虚假连边或是缺失连边。在基于网络结构的链路预测方法中,最常用是共同邻居相似性的方法。Liben-Nowellhe和Kleinberg发现基于节点的共同邻居的方法是预测准确性最好的方法之一。但是,节点之间的共同邻居指标不考虑节点之间的链接方向,无法直接应用于有向网络。预测边与共同邻居构成了闭合的三角形结构,在三角形结构的基础上考虑方向的问题,就构成了有向网络的局部结构,目前,对有向网络结构的研究一部分是基于这类局部结构进行的。基于局部结构进行的有向网络的链路预测中,目前最常用的是基于局部信息相似性的预测方法。真实的复杂网络中,个体之间的关系往往是不对等的,由这种不对等关系构成的网络就是有向网络。在有向网络的链路预测中使用模体来进行链路预测。模体指的是在真实网络中出现的数目远高于随机网络中出现的数目的对应子图。张千明等人提出了有向网络势理论,并发现满足势理论的模体结构具有更好的链路预测效果。但是在他们研究中只考虑了单个模体的链路预测情况,没有考虑到多模体的链路预测。基于模体结构的链路预测方法简单认为:每个节点对于模体构成的贡 ...
【技术保护点】
1.一种融合多模体信息的有向网络链路预测方法,其特征在于,包括如下步骤:/nS1.通过原始有向网络数据构建初始网络,并获取不存在连边的节点对列表;/nS2.随机选取初始网络数据中10%的连边作为测试集正样本,剩余90%的连边作为训练集,从不存在连边的节点对列表中选取与测试集正样本等大的连边集合作为测试集负样本;/nS3.采用朴素贝叶斯模型算法获得初始网络中个体对应的角色函数值;/nS4.从初始网络中的第一节点对开始,根据节点对的共同邻居,得到每一节点对所对应的共同邻居的角色函数R
【技术特征摘要】
1.一种融合多模体信息的有向网络链路预测方法,其特征在于,包括如下步骤:
S1.通过原始有向网络数据构建初始网络,并获取不存在连边的节点对列表;
S2.随机选取初始网络数据中10%的连边作为测试集正样本,剩余90%的连边作为训练集,从不存在连边的节点对列表中选取与测试集正样本等大的连边集合作为测试集负样本;
S3.采用朴素贝叶斯模型算法获得初始网络中个体对应的角色函数值;
S4.从初始网络中的第一节点对开始,根据节点对的共同邻居,得到每一节点对所对应的共同邻居的角色函数Rw列表;
S5.从初始网络中的第一节点对开始,依次计算每对节点的共同邻居相似性指标CN,得到节点对的共同邻居数量;
S6.根据节点对的共同邻居数量和节点对所对应的共同邻居的角色函数得到节点对的r'xy列表;
S7.根据单个模体r'xy列表通过叠加的方式得到双模体的rxy的列表;或者将不同的单个模体得到的r'xy列表使用机器学习的方法XGBoost得到新的score列表。
2.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,使用XGBoost的方法计算所有模体之间的相关性,根据模体之间的相关性进行双模体链路预测的模体选择。
3.根据权利要求1所述一种融合多模体信息的有向网络链路预测方法,其特征在于,共同邻居相似性指标CN的计算方法为:针对无向无权网络,用Γ(a)表示节点a的邻居,Γ(b)表示节点b的邻居,则:
CN(a,b)=|Γ(a)∩Γ(b)|
节点a和节点b的相似性指标等...
【专利技术属性】
技术研发人员:许小可,刘亚芳,毕学良,
申请(专利权)人:大连民族大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。