一种基于渗流过程和进化计算的网络传播源定位方法技术

技术编号:34371306 阅读:31 留言:0更新日期:2022-07-31 11:17
本发明专利技术提供了一种基于渗流过程和进化计算的网络传播源定位方法。首先,输入网络数据集,得到其节点及连边属性,并初始化传播模型参数;然后,基于渗流和进化计算相关理论和方法,采用AEF算法迭代更新初始观察点序列得到最后序列,依照序列在网络中布置一定比例的观察点;其次,随机选择传播源处于感染状态启动传播过程,直到检测到达一定爆发范围时停止传播过程;根据观察点捕获信息寻找目标连通片获取子图,在子图上启动RIS算法检测传播源;最后,将检测传播源的固定跳数之内的邻居加入候选集,该候选集可作为后续搜索真实传播源的范围。本发明专利技术可以实现大型网络的快速传播源定位,从而及时控制恶意信息传播,降低其造成的损失。损失。损失。

A network propagation source location method based on percolation process and evolutionary computation

【技术实现步骤摘要】
一种基于渗流过程和进化计算的网络传播源定位方法


[0001]本专利技术属网络信息传播
,具体涉及一种基于渗流过程和进化计算的网络传播源定位方法。

技术介绍

[0002]在当前世界中存在着如社交网、电力网、公路交通网等各种各样的复杂网络,复杂网络的高互连性和高凝聚力为节点之间信息交流提供便利的同时,也增加了网络中各种风险出现的机会。比如,谣言在社交网络中的快速传播,计算机病毒在短时间内对大量主机的感染,传染疾病在人群中的爆发。因此,快速定位传播源所在区域,控制传播源点扩散带来的影响具有非常重要地研究价值和意义。
[0003]传播源定位问题的主要任务是设计一个可以推断出传播源的估计器,其中最理想的估计器是能寻找到真实源的估计器。然而,由于节点交流模式的复杂性和扩散模型的不确定性,即使底层的网络为树状网络,所设计的估计器在理论上也几乎不可能推断出真实源。因此,误差距离被开发并被用来作为评估一个估计器性能的标准:如果相应的推断源在距离上更接近真实源,则称一个估计器比另一个估计器更好。基于不同的已知信息假设,研究者们开发了不同的方法来最小化误差距离。但在实际中,我们面临的问题是:获得误差距离较小的估计器之后,如何进一步溯源?诚然,人们可以对估计出的传播源的邻近区域进行更密集的检测,最终实现真实源的定位。在此场景下,对于结构相对简单的网络,一个小的误差距离通常预示着我们只需要对很少一部分节点实施进一步更密集的检测来找出真实的传播源。但是,由于大多数现实世界的网络都是异构的,也即在这样的网络中,一个节点可能与多数节点直接相连,那么邻近区域的更密集检测的节点规模可能正比于该网络的大小,这在实际中显然是不可行的。
[0004]迄今为止,针对复杂网络中的传播源定位已经有大量的研究,越来越多的算法被提出以检测网络中携带虚假或恶意信息的传播源。传播源定位的算法总体上可分为三大类:1)基于完全观察图的方法,即研究者获取网络所有节点的状态信息及感染时间信息检测传播源,比如谣言中心性、最小描述长度方法、节点动态年龄的源识别方法。2)基于网络快照观察的方法,即研究者获取网络中在单位时间内各节点接收和传播信息的情况,相对完全观察图来言,该条件更容易得到满足。比如Jordan中心方法、动态消息传播方法。3)基于传感器观察的方法,即研究者在网络中布置一定数量的观察点作为传感器,获取特定节点的传染信息检测网络中的传播源。Pinto等人在2012年首次提出了这类方法,它基于两个假设,一是网络传播时延服从高斯分布,二是信息的传播路径是以节点为根的深度遍历树。通过监测观察点状态初次改变的时间以及信息来源的方向,利用最大似然估计的方法估计传播源。节点中心性方法是分析网络属性的一种可行手段,有些算法也采用各种中心性方法来识别传播源,比如度中心性、接近中心性、介数中心性。
[0005]传播源节点检测问题意义重大,但目前仍然存在一些问题。一方面,当前大多数方法均是基于树形结构网络设计,而实际中的大多数网络都是复杂网络。因此,直接在一般网
络上使用或扩展基于树形网络的方法进行传播源检测,通常会存在检测效率降低、准确性难以保证等问题。另一方面,目前大多数方法是针对小型网络而设计,计算复杂度较高,难以实际应用到一般大规模网络中。

技术实现思路

[0006]为了克服现有技术的不足,本专利技术提供一种基于渗流过程和进化计算的网络传播源定位方法。首先,输入网络数据集,得到其节点及连边属性,并初始化传播模型参数;然后,基于渗流和进化计算相关理论和方法,采用AEF算法迭代更新初始观察点序列得到最后序列,依照序列在网络中布置一定比例的观察点;其次,随机选择传播源处于感染状态启动传播过程,直到检测到达一定爆发范围时停止传播过程;根据观察点捕获信息寻找目标连通片获取子图V

c
,在子图V

c
上启动RIS算法检测传播源;最后,将检测传播源的固定跳数之内的邻居加入候选集,该候选集可作为后续搜索真实传播源的范围。本专利技术可以实现大型网络的快速传播源定位,从而及时控制恶意信息传播,降低其造成的损失。
[0007]一种基于渗流过程和进化计算的网络传播源定位方法,其特征在于步骤如下:
[0008]步骤1:输入实验网络数据集G(V,E),其中,V表示网络节点集合,E表示网络中的边集合;初始化固定传播模型的边感染率β
uv
、节点恢复率γ
u
,边感染率β
uv
的取值范围为[0,1],节点恢复率γ
u
的取值范围为[0,1];确定爆发率ε,爆发率ε取值范围为[0,1];初始化网络中所有节点均处于易感状态;
[0009]步骤2:采用随机排序或节点度排序方法构建得到初始图全体节点序列S,并采用 AEF算法对节点序列S进行更新,对于更新后节点序列,按照从前往后的顺序选择比例 q个节点作为观察点,并构成观察点集合O,将观察点标记在网络上,记录观察点被感染的绝对时间,从观察点集合O中随机确定占比为R
d
=|O
d
|/|O|个观察点构成集合 O
d
,记录观察点被感染的方向信息;q的取值范围为[0,0.2],R
d
的取值范围为[0.001,1];
[0010]步骤3:在t=0时刻,从数据集G(V,E)所有节点中随机选择传播源v
s
处于感染状态,启动传播过程;在传播过程中,观察点记录自己被感染的绝对时间,集合O
d
中的观察点同时还记录被感染的方向信息,处于感染状态的节点以边感染率β
uv
传播病毒给处于易感状态的邻居节点,同时,处于感染状态的节点以恢复率γ
u
进入恢复状态,被感染节点进入感染状态成为新感染节点,处于感染状态的全体节点继续进行传播行为,直至网络中的感染节点数n1和恢复节点数n2满足(n1+n2)/n≥ε,停止传播过程,此时得到的节点感染情况分布图构成感染图G
I
;其中,n表示网络G中包含的节点数量;
[0011]步骤4:以步骤2中的观察点集合O作为移除节点集V
r
,数据集G中除观察点外的其他节点构成剩余节点集V
o
;针对移除节点集V
r
,移除集合V
o
中的节点与V
r
中节点相连的边后得到若干大小不同且大于1的连通片,标记为c
i
,表示第i个连通片,其中 i=1,2,

,C,C表示连通片总数;按照确定连通片c
i
的边界其中,u表示移除节点集V
r
中的任意节点,v表示连通片c
i
中的任意节点,e
uv
表示感染图G
I
中连接节点u和节点v的边;按照确定移除节点集V
r
中的任意节点u的连通覆盖区域α(u),其中,Γ(u)表示节点u在感染图G
I...

【技术保护点】

【技术特征摘要】
1.一种基于渗流过程和进化计算的网络传播源定位方法,其特征在于步骤如下:步骤1:输入实验网络数据集G(V,E),其中,V表示网络节点集合,E表示网络中的边集合;初始化固定传播模型的边感染率β
uv
、节点恢复率γ
u
,边感染率β
uv
的取值范围为[0,1],节点恢复率γ
u
的取值范围为[0,1];确定爆发率ε,爆发率ε取值范围为[0,1];初始化网络中所有节点均处于易感状态;步骤2:采用随机排序或节点度排序方法构建得到初始图全体节点序列S,并采用AEF算法对节点序列S进行更新,对于更新后节点序列,按照从前往后的顺序选择比例q个节点作为观察点,并构成观察点集合O,将观察点标记在网络上,记录观察点被感染的绝对时间,从观察点集合O中随机确定占比为R
d
=|O
d
|/|O|个观察点构成集合O
d
,记录观察点被感染的方向信息;q的取值范围为[0,0.2],R
d
的取值范围为[0.001,1];步骤3:在t=0时刻,从数据集G(V,E)所有节点中随机选择传播源v
s
处于感染状态,启动传播过程;在传播过程中,观察点记录自己被感染的绝对时间,集合O
d
中的观察点同时还记录被感染的方向信息,处于感染状态的节点以边感染率β
uv
传播病毒给处于易感状态的邻居节点,同时,处于感染状态的节点以恢复率γ
u
进入恢复状态,被感染节点进入感染状态成为新感染节点,处于感染状态的全体节点继续进行传播行为,直至网络中的感染节点数n1和恢复节点数n2满足(n1+n2)/n≥ε,停止传播过程,此时得到的节点感染情况分布图构成感染图G
I
;其中,n表示网络G中包含的节点数量;步骤4:以步骤2中的观察点集合O作为移除节点集V
r
,数据集G中除观察点外的其他节点构成剩余节点集V
o
;针对移除节点集V
r
,移除集合V
o
中的节点与V
r
中节点相连的边后得到若干大小不同且大于1的连通片,标记为c
i
,表示第i个连通片,其中i=1,2,

,C,C表示连通片总数;按照确定连通片c
i
的边界其中,u表示移除节点集V
r
中的任意节点,v表示连通片c
i
中的任意节点,e
uv
表示感染图G
I
中连接节点u和节点v的边;按照确定移除节点集V
r
中的任意节点u的连通覆盖区域α(u),其中,Γ(u)表示节点u在感染图G
I
中的邻居节点集,c
i
(v)表示节点v所属的连通片c
i
;步骤5:选择被感染时间最早的观察点构成被感染观察点子集合O

;按照公式构建子图V

c
,其中,x表示被感染观察点子集合O

中的任意观察点,α(x)表示观察点x在感染图G
I
中的邻居节点所在的连通片覆盖区域;步骤6:按照t

x
=t
x

t
min
计算感染相对时间t

x
,其中,t
x
表示观察点x被感染的时间,在子图V

c
上采用RIS算法寻找得到传播源步骤7:将传播源的固定阶数之内的邻居节点加入候选集V
c
,以候选集的相对大小φ=|V
c
|/n作为评价指标,φ越小表示遏制感染的范围越小;其中,|V
c
|表示候选集V
c
包含的节点数量,所述的固定阶数为一阶或二阶。2.如权利要求1所述的一种基于渗流过程和进化计算的网络传播源定位方法,其特征在于:步骤2中所述的采用AEF算法对节点序列S进行更新的具体过程为:步骤a:按照随机确定序列分段的段长参数n
s
,将节点序列S由前往后进行分段,每段包含n
s
个节点,记第k段序列为S
k
,其中,n为序列S包含的节点总数,k=1,
2,...,K,K为序列分段的总段数;步骤b:对于每一个分段序列S
k
按照以下过程并行进行更新,得到更新后的分段序列S
k
,其中更新次数为步骤S1:参数初始化,令循环计次变量j=n
s
,初始中间节点序列S

k
=S
k
,构造初始子图G

k
(V

k
,E

k
)的网络,其中,令表示序列S
k
之后的所有序列的拼接序列,V

k
为子图的节点集,包含序列所有节点,E

k
=E∩(V

k
...

【专利技术属性】
技术研发人员:刘洋汪小琦王震王茜李学龙
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1