当前位置: 首页 > 专利查询>河南大学专利>正文

一种基于共识社团布谷鸟算法的动态网络聚类方法及系统技术方案

技术编号:31570422 阅读:15 留言:0更新日期:2021-12-25 11:09
本发明专利技术公开一种基于共识社团布谷鸟算法的动态网络聚类方法及系统,该方法包括:采用标签传播算法得到初始时刻的社团划分,获得社团内共识;从第2个时刻开始,采用基于有序邻居列表的编码方式生成鸟巢群落;采用经过重定义的莱维飞行公式对鸟巢的位置进行更新,按照放弃算子对部分鸟巢进行重建;对鸟巢进行排序,经过精英选择策略从群落中保留适应度好的鸟巢;鸟巢对社团内共识进行投票以获得当前时刻的社团间共识,将社团间共识插入到群落当中;重新计算社团内共识用于下一时刻群落的更新,选择knee解作为最优解,输出该时刻所对应的动态网络划分结果,直至得到每个时刻下的社团结构。本发明专利技术可以保证当前时刻的社团向与上一时刻相似的方向进化。刻相似的方向进化。刻相似的方向进化。

【技术实现步骤摘要】
一种基于共识社团布谷鸟算法的动态网络聚类方法及系统


[0001]本专利技术属于动态网络社团检测
,尤其涉及一种基于共识社团布谷鸟算法的动态网络聚类方法及系统。

技术介绍

[0002]随着计算机技术的迅猛发展,从复杂网络中发现社团结构在这十几年里得到了广泛研究。复杂网络可以将现实中抽象的复杂系统进行建模,其中节点代表系统中的实体,边代表实体间的联系。复杂网络的社团发现已经在社会网络、信息网络、生物网络中得到了充分的应用。例如,在科学家协作网络中,社团结构表示发表过相同或相似领域的科学家们;在Web页面网络,社团结构表示有着相同或相似主题的一组页面;在蛋白质相互作用网络中,社团结构表示提供相同或者辅助作用的蛋白质集合。寻找这种结构的研究问题称为社团检测(聚类)问题。
[0003]社区检测可以转化为对优化问题求最优解,其难度为NP级。因此,许多研究人员将进化算法(EAs)引入到这一
,并开发了一些有前途的解决方案。然而,这些算法只能发现静态网络中的社区。但是,现实世界的网络不总是静态的,而是处于动态变化中。例如,在科学协作网络中,社区是动态发展的,由于科学家对研究兴趣和方向发生改变,相应的社团结构也会发生变化;蛋白质与蛋白质的相互作用随时间和空间而变化,从而导致蛋白质复合物在细胞周期过程中组装和拆卸。随着科学家们逐渐重视事物的动态变化,动态网络在许多领域越来越受欢迎,因为它在为跟踪网络结构的动态变化提供了大量的机会。
[0004]进化聚类是目前广泛用于动态网络社团检测的框架。它的主要思想是在一种时间平滑框架下,在每个时间步上生成聚类。这个时间平滑框架假定在一段很短的时间间隔内社团的改变很小,且最好的社团结构应当通过同时考虑当前时刻和前一时刻的社团结构来获得。因此,进化聚类符合动态网络社区检测涉及的两个相互冲突的准则。第一个是快照质量的最大化,它衡量的是当前时刻社团对快照的效率。第二种是时间代价最小化,表示两个聚类在连续时间步长的距离。动态网络中社区结构的检测可表示为一个多目标优化问题(MOP)。为此,提出了一种动态多目标遗传算法(dynamic multiobjective genetic algorithms,DYNMOGA)[D.Chakrabarti,R.Kumar,and A.Tomkins,“Evolutionary clustering,”in Proc.ACM SIGKDD Int.Conf.Knowl.Disc.Data Min.,2006,pp.554

560.],利用遗传算法发现动态网络中的群落,优化了归一化互信息(NMI)[L.Danon,A.D
í
az

Guilera,J.Duch,and A.Arenas,“Comparing community structure identifification,”J.Stat.Mech.Theory Exp.,vol.2005,no.9,2005,Art.no.P09008.]和模块化[M.Girvan and M.E.Newman,“Community structure in social and biological networks,”Proc.Nat.Acad.Sci.USA,vol.99,no.12,pp.7821

7826,2002.]。第一个目标NMI是信息论中一个众所周知的熵度量,它量化了当前时刻和上一时刻的两个社团结构的相似性。第二个目标,模块化,是快照质量的最大化,它度量社团在当前时间代表网络的程度。
[0005]然而,DYNMOGA有一个缺陷。虽然模块化和NMI在每个时刻同时优化,但该算法不能保证社团朝着与上一时刻相似的方向进化。在进化过程中,如果社团发现的解是高度模块化的,但是在进化过程中NMI很差,那么这些解将被保留,因为它们不是非支配解。因此,该算法不能保证新发现的解决方案能够改进NMI。

技术实现思路

[0006]本专利技术针对现有动态网络聚类方法存在的不能保证新发现的解决方案能够改进归一化互信息的问题,提出一种基于共识社团布谷鸟算法的动态网络聚类方法及系统。
[0007]为了实现上述目的,本专利技术采用以下技术方案:
[0008]本专利技术一方面提出一种基于共识社团布谷鸟算法的动态网络聚类方法,包括:
[0009]步骤1:采用标签传播算法得到初始时刻的社团划分,获得社团内共识;
[0010]步骤2:从第2个时刻开始,采用基于有序邻居列表的编码方式生成鸟巢群落;
[0011]步骤3:采用经过重定义的莱维飞行公式对鸟巢的位置进行更新,按照放弃算子对部分鸟巢进行重建,从整体上完成对群落的更新操作;
[0012]步骤4:采用拥挤度距离和非占优排序机制对鸟巢进行排序,经过精英选择策略从群落中保留适应度好的鸟巢取代原有的鸟巢;
[0013]步骤5:完成择优操作后,鸟巢对社团内共识进行投票以获得当前时刻的社团间共识,将社团间共识插入到群落当中;
[0014]步骤6:重新计算社团内共识用于下一时刻群落的更新,从非占优解中选择knee解作为最优解,输出该时刻所对应的动态网络划分结果,重复上述操作得到每个时刻下的社团结构。
[0015]进一步地,所述社团内共识按照如下方式获得:
[0016]采用求交集的方法从如下三个解决方案中获得社团的一致性意见:
[0017]1)最小KKM的解;2)最小RC的解;3)膝关节knee解决方案;
[0018][0019]膝关节knee解决方案定义如下:
[0020][0021]式中,KKM和RC是公式(1)中所定义的目标函数,其中KKM和RC的解空间构成目标空间;PS是Pareto最优解集;x是属于PS中的解;KKM(x)和RC(x)是解x的目标函数值;KKM
max
和KKM
min
是PS中目标函数KKM的最大值和最小值;RC
max
和RC
min
是PS中目标函数RC的最大值和最小值;和表示在一个社团节点集V
s
中节点内之间的度和节点外之间的度,表示非社团节点集V
s
中节点;|.|表示集合的大小,n表示节点的数量,k表示社团的数量;
[0022]社团内共识定义为:
[0023]intraCC(CR1,CR2,CR3)={A∩B∩C|A∈CR1,B∈CR2,C∈CR3,|A∩B∩C|≥2}
ꢀꢀ
(3)
[0024]其中CR1、CR2、CR3依次代表动态网络G的上述三个解决方案;|A∩B∩C|表示A∩B∩C集合中公共的部分,A、B、C依次表示上述三个解决方案内的社团。
[0025]进一步地,所述莱维飞行公式的重定义过程为:
[0026]采用映射方式将飞行方式进行重定义,设随机步长并且S=(S1,S2,...,S
n
),S1,S2,S
n
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于共识社团布谷鸟算法的动态网络聚类方法,其特征在于,包括:步骤1:采用标签传播算法得到初始时刻的社团划分,获得社团内共识;步骤2:从第2个时刻开始,采用基于有序邻居列表的编码方式生成鸟巢群落;步骤3:采用经过重定义的莱维飞行公式对鸟巢的位置进行更新,按照放弃算子对部分鸟巢进行重建,从整体上完成对群落的更新操作;步骤4:采用拥挤度距离和非占优排序机制对鸟巢进行排序,经过精英选择策略从群落中保留适应度好的鸟巢取代原有的鸟巢;步骤5:完成择优操作后,鸟巢对社团内共识进行投票以获得当前时刻的社团间共识,将社团间共识插入到群落当中;步骤6:重新计算社团内共识用于下一时刻群落的更新,从非占优解中选择knee解作为最优解,输出该时刻所对应的动态网络划分结果,重复上述操作得到每个时刻下的社团结构。2.根据权利要求1所述的一种基于共识社团布谷鸟算法的动态网络聚类方法,其特征在于,所述社团内共识按照如下方式获得:采用求交集的方法从如下三个解决方案中获得社团的一致性意见:1)最小KKM的解;2)最小RC的解;3)膝关节knee解决方案;膝关节knee解决方案定义如下:式中,KKM和RC是公式(1)中所定义的目标函数,其中KKM和RC的解空间构成目标空间;PS是Pareto最优解集;x是属于PS中的解;KKM(x)和RC(x)是解x的目标函数值;KKM
max
和KKM
min
是PS中目标函数KKM的最大值和最小值;RC
max
和RC
min
是PS中目标函数RC的最大值和最小值;和表示在一个社团节点集V
s
中节点内之间的度和节点外之间的度,表示非社团节点集V
s
中节点;|.|表示集合的大小,n表示节点的数量,k表示社团的数量;社团内共识定义为:intraCC(CR1,CR2,CR3)={A∩B∩C|A∈CR1,B∈CR2,C∈CR3,|A∩B∩C|≥2}
ꢀꢀꢀ
(3)其中CR1、CR2、CR3依次代表动态网络G的上述三个解决方案;|A∩B∩C|表示A∩B∩C集合中公共的部分,A、B、C依次表示上述三个解决方案内的社团。3.根据权利要求1所述的一种基于共识社团布谷鸟算法的动态网络聚类方法,其特征在于,所述莱维飞行公式的重定义过程为:采用映射方式将飞行方式进行重定义,设随机步长并且S=(S1,S2,...,S
n
),
S1,S2,S
n
分别表示第1维、第2维、第n维的随机步长,为了得到离散型数值,通过公式(7),公式(8)将S映射成0或1的S',S'=(S'1,S'2,S'3,...,S'
n
):):经过重定义后,得到新的位置更新公式,具体如下:经过重定义后,得到新的位置更新公式,具体如下:经过重定义后,得到新的位置更新公式,具体如下:经过重定义后,得到新的位置更新公式,具体如下:式中u和v是符合正态分布的随机数,式中u和v是符合正态分布的随机数,σ
v
=1,Γ是gamma函数,定义为Levy(β)是服从β的莱维分布的随机搜索向量,0<β<2;是布谷鸟在第t次搜索中第i个鸟巢的位置;x
t+1
是通过计算得到的第t+1代的新个体;α为步长因子,α0=1,best
t
是第t代最优个体;n表示动态网络G中节点的数量;X是第j维的更新位置;L
j
表示第j维的邻居列表长度。4.根据权利要求1所述的一种基于共识社团布谷鸟算法的动态网络聚类方法,其特征在于,所述社团间共识的计算过程包括:采用支持度作为指标来衡量当前群体中出现共识社区的频率:给出一个节点集s,则群体是POP={p1,p2,p3,...,p
n
},其中n是解的个数,是一种将动态网络划分为m个社团的解决方案,s对POP的支持度定义为p
i
中的在节点集s中所占的比例,计算如下:5.一种基于共识社团布谷鸟算法的动态...

【专利技术属性】
技术研发人员:陈国强马岩赵艳丽周宏基
申请(专利权)人:河南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1