基于签名网络的极大平衡社区及其搜索方法技术

技术编号:33904153 阅读:24 留言:0更新日期:2022-06-25 18:23
本发明专利技术提出了一种基于签名网络的极大平衡社区,包括:所述平衡社区是结构平衡的,即社区内的点可分为两个子图,同一子图内的任意边都是正边,不同子图间的任意边都是负边;所述平衡社区是结构紧密的,即任意两点之间都有边相连;所述平衡社区的两个子图的点数分别不能小于一个用户给定的阈值;所述平衡社区是极大子图,即不会有任意点可以被加入到当前的子图中。本发明专利技术还提出了极大平衡社区的搜索方法。本发明专利技术还提出了极大平衡社区的搜索方法。本发明专利技术还提出了极大平衡社区的搜索方法。

【技术实现步骤摘要】
基于签名网络的极大平衡社区及其搜索方法


[0001]本专利技术属于图数据查询与分析
,具体来说是,稠密社区模型的设计与搜索
,提出了一种基于签名网络的极大平衡社区及其搜索方法。

技术介绍

[0002]签名网络近年来备受关注。在之前的工作中,人们广泛地研究了签名网络中潜在的社会动力学过程的理论。在这些理论中,结构平衡理论是最基本和最主要的理论。此后,结构平衡理论得到了广泛的发展。在这些工作中,值得注意的是,通过对签名网络的演化过程进行建模,从理论上证明了当顶点间初始友好度的平均值μ≤0时,网络将演化为一个平衡社区。
[0003]除了签名网络理论外,大量的挖掘签名网络的文献已经出现。其中,与本专利技术最密切相关的工作是(α,k)

社区模型。给定一个签名网络G,(α,k)

社区定义为极大社区C,使得C中每个顶点的负度数不大于k,C中每个顶点的正度数不小于αk,(α,k)

社区模型只考虑了社区中正负边的数量,完全忽略了社区的结构平衡,使得(α,k)

社区模型与本专利技术的模型有本质的不同。
[0004]社区模型是最基本的内聚子图模型之一。有学者研究了二分图上的极大双社区搜索问题。通过保持一边的顶点集的增长,另一边的顶点集的剥离来搜索极大双社区。它还利用了一些技术来进一步提高搜索性能,如从候选集中选择度数较小的顶点来减少搜索树的深度,以及对可能产生非极大双社区的顶点进行修剪等。注意,本专利技术的平衡社区模型不同于现有的无签名网络内聚子图模型,现有的研究无法很好地解决这个问题。如果只考虑签名网络中的正边,而使用传统的无签名网络方法进行社区检测,则发现的结果会忽略负边,从而丢失签名网络中一半有意义的信息。
[0005]图是一个由点和边构成的抽象模型。随着图论应用的激增,研究人员致力于研究和分析基于图数据的诸多基本问题。社区模型在社会网络挖掘、金融分析和计算生物学等领域有着广泛的应用前景,并得到了广泛的研究。现有的关于社区的研究主要集中在无签名网络上,即图中的所有边都具有相同的性质。不幸的是,在许多现实世界的应用场景中,两个实体之间的关系具有完全相反的属性,例如社交网络中用户之间的朋友

敌人关系,支持意见网络中的不同意见,信任网络中的信任

不信任关系和蛋白质相互作用网络中的伙伴

对抗关系。将这些应用程序建模为带正负边的签名网络,可以使它们能够捕捉到比无签名网络更复杂的语义。因此,现有的基于无签名网络的社区的研究可能不适合刻画签名网络中的内聚子图,因此迫切需要为签名网络定义一个特殊的社区模型。
[0006]对于签名网络,揭示签名网络动态和结构的最基本和最主要的理论是结构平衡理论。结构平衡理论背后的理论依据可以被描述为格言:“朋友的朋友是我的朋友,朋友的敌人是我的敌人”。具体地说,对于一个签名网络G,如果G可以分成两个子图,使得同一子图中的边是正向的,子图之间的边是负向的,则G是结构平衡的。在签名网络中,一个不平衡的子图结构是不稳定的,并且趋向于进化到平衡状态。
[0007]根据以上分析,社区模型是图分析中的一种基本的内聚子图模型,可以应用于许多领域,但在签名网络中没有合适的模型。同时,基于结构平衡理论,签名网络的结构被期望是平衡的。基于此,本专利技术提出了一个极大平衡社区模型。定义为,给定签名网络G,极大平衡社区C是 G的极大子图,使得(1)C是完全连通的,即C中的每对顶点都有一条边。(2)C是平衡的,即C可以分成两部分,使得同一部分的边是正向的,连接两部分的边是负向的。该定义不仅抓住了无签名网络中社区模型的本质,而且保证了检测到的社区在签名网络中是稳定的。

技术实现思路

[0008]本专利技术的目的是设计一个有效的算法来搜索给定签名网络中所有极大平衡社区,并且可以实时更新结果。
[0009]基于在签名网络中最基本和最主要的理论,即结构平衡理论,本专利技术提出了一个平衡的社区模型,并且提出多种基于签名网络的平衡社区搜索算法,以应对复杂的应用场景,如时间响应要求过高;图数据过大,超出内部存储空间范围;图数据不断动态更新等多种情况。本专利技术提出的基于签名网络的平衡社区搜索系统流程图如图1所示,具体流程如下:
[0010](1)搜索所有极大平衡社区。针对平衡社区模型,本专利技术利用签名网络的独特性质,提出了一种极大平衡社区搜索算法,并在此的基础上,设计了优化策略,从而进一步提高搜索效率。对于多核CPU运行环境,本专利技术提出了利用多核CPU的并行搜索算法,提高运行效率。对于局限的内存环境和超大规模图数据,本专利技术提出了基于外部存储的搜索算法。
[0011](2)增量计算。针对动态图,本专利技术提出了通过增量计算对现有结果进行实时维护和更新的算法。
[0012]本专利技术提出了一种基于签名网络的极大平衡社区,所述极大平衡社区的特点包括:所述平衡社区是结构平衡的,即社区内的点可分为两个子图,同一子图内的任意边都是正边,不同子图间的任意边都是负边;所述平衡社区是结构紧密的,即任意两点之间都有边相连;所述平衡社区的两个子图的点数分别不能小于一个用户给定的阈值;所述平衡社区是极大子图,即不会有任意点可以被加入到当前的子图中。
[0013]其中,极大平衡社区引理包括:给定一个签名网络,和一个平衡社区,如果一个点与平衡社区里的每个点都有边相连,同时与平衡社区的一个单边子图相连的边都为正边,与另一个单边子图的边都为负边,那么这个点可以被加入到当前的平衡社区里来,形成一个更大的平衡社区。
[0014]基于以上极大平衡社区,本专利技术还提出了一种极大平衡社区的搜索方法,包括以下步骤:
[0015]步骤(1),给定一个签名网络,选定每一个点作为平衡社区的初始点,该点的邻居为候选集;
[0016]步骤(2),每次从候选集中挑选点,加入到当前的平衡社区中,如果一个点被搜索过了,就把它从候选集中移除,并且标记已搜索,重复步骤(2),直到候选集为空;
[0017]步骤(3),判断搜索到的平衡社区是否合理,判断条件如下:
[0018]判断条件(3.1),是否存在一个已经被搜索过的点,使得该点可以被加入到当前的
平衡社区中,若有,则当前的平衡社区已经被搜索过,不是极大的;
[0019]判断条件(3.2),当前平衡社区的两个子图的点数是否都大于阈值。
[0020]本专利技术中,如果当前平衡社区的单边点数和单边候选集点数之和小于阈值,则当前搜索分支无效;或,如果存在已经搜索过的点,该点与当前平衡社区的点和候选集均有有效边相连,则当前搜索分支无效;或,如果当前平衡社区与候选集可以组成一个极大平衡社区,则直接终止搜索;或,如果一个点的正向度数小于阈值

1,或者负向度数小于阈值,则这个点不会出现在任何一个平衡社区中。
[0021]本专利技术中,每个点搜索它所在的平衡社区的过程是相互独立的,利用多核CPU来进行并行运算,为每个点创建一个单独的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于签名网络的极大平衡社区,其特征在于,包括:所述平衡社区是结构平衡的,即社区内的点可分为两个子图,同一子图内的任意边都是正边,不同子图间的任意边都是负边;所述平衡社区是结构紧密的,即任意两点之间都有边相连;所述平衡社区的两个子图的点数分别不能小于一个用户给定的阈值;所述平衡社区是极大子图,即不会有任意点可以被加入到当前的子图中。2.根据权利要求1所述的基于签名网络的平衡社区,其特征在于,极大平衡社区引理包括:给定一个签名网络,和一个平衡社区,如果一个点与平衡社区里的每个点都有边相连,同时与平衡社区的一个单边子图相连的边都为正边,与另一个单边子图的边都为负边,那么这个点可以被加入到当前的平衡社区里来,形成一个更大的平衡社区。3.一种如权利要求1或2所述的极大平衡社区的搜索方法,包括以下步骤:步骤(3.1),给定一个签名网络,选定每一个点作为平衡社区的初始点,该点的邻居为候选集;步骤(3.2),每次从候选集中挑选点,加入到当前的平衡社区中,如果一个点被搜索过了,就把它从候选集中移除,并且标记已搜索,重复步骤(3.2),直到候选集为空;步骤(3.3),判断搜索到的平衡社区是否合理,判断条件如下:判断条件(3.3.1),是否存在一个已经被搜索过的点,使得该点可以被加入到当前的平衡社区中,若有,则当前的平衡社区已经被搜索过,不是极大的;判断条件(3.3.2),当前平衡社区的两个子图的点数是否都大于阈值。4.根据权利要求3所述的极大平衡社区的搜索方法,其特征在于,如果当前平衡社区的单边点数和单边候选集点数之和小于阈值,则当前搜索分支无效;或,如果存在已经搜索过的点,该点与当前平衡社区的点和候选集均有有效边相连,则当前搜索分支无效;或,如果当前平衡社区与候选集可以组成一个极大平衡社区,则直接终止搜索;或,如果一个点的正向度数小于阈值

1,或者负向度数小于阈值,则这个点不会出现在任何一个平衡社区中。5.根据权利要求3所述的极大平衡社区的搜索方法,其特征在于,每个点搜索它所在的平衡社区的过程是相互独立的,利用多核CPU来进行并行运算,为每个点创建一个单独的线程,使得多个点可以同时搜索它们所在的平衡社区...

【专利技术属性】
技术研发人员:陈紫袁龙倪茴茴王丽苹
申请(专利权)人:君烁上海信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1