基于社团结构的链路预测的方法和系统技术方案

技术编号:15029782 阅读:32 留言:0更新日期:2017-04-05 07:45
本发明专利技术提供一种基于社团结构的链路预测的方法和系统,该方法包括:获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;根据所述行为特征获取各所述节点之间生成连边的各概率分布;将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。本发明专利技术能够提高链路预测的准确性。

【技术实现步骤摘要】

本专利技术涉及链路预测领域,尤其涉及一种基于社团结构的链路预测的方法和系统
技术介绍
网络在人类和自然界中普遍存在。随着科学技术的不断发展,人们对于网络的认知也有了更深刻的理解,对于网络的了解也可以帮助人类进一步认知世界。在网络科学研究中,将某个实际问题抽象为一个网络(例如:通信网络、社交网络、信息网络、电力网络、交通网络、社会接触网络等),其中包括节点集合和连边的集合。节点之间的连线称为连边(也称链路),表示节点之间的某种联系,常常与具体实际问题相关,例如:无线移动网络中两个节点可以或正在通信、合著者网络中两个作者之间存在合著关系等等。预测节点之间是否会存在有连边称为链路预测。链路预测是指通过利用网络的已知节点信息和结构信息对网络中尚未产生连边的两个节点之间可能产生的连边进行预测。链路预测的研究与网络的结构和演化的联系非常密切。目前,链路预测是网络研究领域中一个新兴的、具有重要理论与应用价值的研究方向。在理论方面,链路预测可以用来理解、揭示和比较复杂网络中的可能的演化机制,通过预测和真实网络的比较,就可以得到网络结构预测的准确性;链路预测在影响分析力、生物科学实验、商品推荐、信息传播、网络营销等领域有重要应用,如生物方面,为了避免盲目通过实验来检测蛋白质的作用,可以先通过链路预测来估计蛋白质的相互作用,从而指导实验,避免了大量实验和实验材料的浪费。因此,如何准确的实现链路预测成为亟需解决的问题。
技术实现思路
本专利技术提供一种基于社团结构的链路预测的方法和系统,以进行准确的链路预测。本专利技术第一个方面提供一种基于社团结构的链路预测的方法,包括:获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;根据所述行为特征获取各所述节点之间生成连边的各概率分布;将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。根据如上所述的方法,可选地,所述根据所述行为特征获取各所述节点之间生成连边的各概率分布,具体包括:对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;|C|表示所述社团结构C中的节点总个数;f(mp,C)表示所述社团结构C中具有属性mp的节点个数;f(mq,C)表示所述社团结构C中具有属性mq的节点个数;B(C)表示所述社团结构C的连边的总条数;O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。根据如上所述的方法,可选地,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。根据如上所述的方法,可选地,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;所述连接倾向特征包括:亲密度。本专利技术第二个方面提供一种基于社团结构的链路预测的系统,包括:获取模块,用于获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;计算模块,用于根据所述行为特征获取各所述节点之间生成连边的各概率分布;确定模块,用于将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。根据如上所述的系统,可选地,所述计算模块具体用于包括:对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;|C|表示所述社团结构C中的节点总个数;f(mp,C)表示所述社团结构C中具有属性mp的节点个数;f(mq,C)表示所述社团结构C中具有属性mq的节点个数;B(C)表示所述社团结构C的连边的总条数;O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。根据如上所述的系统,可选地,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。根据如上所述的系统,可选地,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;所述连接倾向特征包括:亲密度。本实施例提供的基于社团结构的链路预测的方法和系统,首先获取社团结构中每个节点的每个属性对应的行为特征,然后根据各个节点的行为特征获取各节点之间生成连边的各概率分布,最后根据概率较大的前L个概率分布确定社团结构的预测链路,由于行为特征本身与连边有关,而链路预测也是与连边有着紧密的联系,因此,通过每个节点的每个属性对应的行为特征来对社团结构进行链路预测,不仅考虑了节点本身的属性,还考虑了节点行为特征,这样能够提高链路预测的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的基于社团结构的链路预测的方法的流程图。图2为本专利技术另一实施例提供的基于社团结构的链路预测的系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本文档来自技高网...

【技术保护点】
一种基于社团结构的链路预测的方法,其特征在于,包括:获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;根据所述行为特征获取各所述节点之间生成连边的各概率分布;将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。

【技术特征摘要】
1.一种基于社团结构的链路预测的方法,其特征在于,包括:获取社团结构中每个节点的每个属性对应的行为特征,所述行为特征包括所述节点对应的连边的条数以及连边的方向,所述连边为两个节点之间的连线,所述社团结构中包括多个节点;根据所述行为特征获取各所述节点之间生成连边的各概率分布;将各概率分布从大到小依次排序,根据前L个的概率分布所对应的连边获取所述社团结构的预测链路,L为正整数。2.根据权利要求1所述的方法,其特征在于,所述根据所述行为特征获取各所述节点之间生成连边的各概率分布,具体包括:对所述社团结构C中的任意节点j和k,采用如下公式获取具有属性mp的所述节点j和具有属性mq的所述节点k之间生成连边的子概率分布S(mp,mq,C):S(mp,mq,C)=α1·O(mp,C)f2(mp,C)+α2·E(mq,C)f2(mq,C)+α3·I(mp,mq,C)f(mp,C)·f(mq,C)+α4B(C)|C|2]]>其中,α1、α2、α3、α4均表示权重因子,并且满足i为正整数;|C|表示所述社团结构C中的节点总个数;f(mp,C)表示所述社团结构C中具有属性mp的节点个数;f(mq,C)表示所述社团结构C中具有属性mq的节点个数;B(C)表示所述社团结构C的连边的总条数;O(mp,C)表示所述社团结构C中以具有属性mp的节点作为源节点的连边的条数;E(mq,C)表示所述社团结构C中以具有属性mq的节点作为目的节点的连边的条数;I(mp,mq,C)表示所述社团结构C中源节点具有属性mp同时目的节点具有属性mq的连边的条数;其中,所述连边的方向所指向的节点为目的节点,所述连边的另一个节点为源节点,mp表示节点j的第p个属性特征,mq表示节点k的第q个属性特征,p和q均为正整数,所述属性mp和所述属性mq同类;根据通过所述公式得到的各子概率分布之和获取所述节点j和所述节点k之间生成连边的概率分布。3.根据权利要求2所述的方法,其特征在于,所述α1、α2、α3、α4中,α3最大,α4最小,α1和α2大小相同。4.根据权利要求2或3所述的方法,其特征在于,所述节点的属性为以下各类特征中的一种:局部特征、自我网络特征、节点连接倾向特征;其中,所述局部特征包括:以所述节点为源节点的连边的条数、以所述节点为目的节点的连边的条数、以所述节点为源节点的连边的条数和以所述节点为目的节点的连边的条数之和、聚类系数;所述自我网络特征包括:自我网络的边数、进入自我网络的边数、离开自我网络的边数;所述连接倾向特征包括:亲密...

【专利技术属性】
技术研发人员:时岩陈滨陈山枝
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1