【技术实现步骤摘要】
一种面向噪声数据环境的传播网络结构重构方法及装置
[0001]本专利技术属于信息传播领域,具体涉及一种面向噪声数据环境的传播网络结构重构方法及装置。
技术介绍
[0002]信息传播网络的拓扑结构可以直观显示网络节点之间影响关系,对于揭示扩散动力学的内在机制至关重要。一般来说,信息传播网络的拓扑结构是无法直接得到的,需要从历史扩散过程中观察得到最终感染结果重构。信息传播网络重构问题越来越受到广泛的关注,如病毒营销、流行病预防,因为重构出的信息传播网络拓扑可以让专业人员直观的理解节点之间的潜在交互,并帮助他们更好的预测、促进或预防未来的信息传播。
[0003]已有的重构方法中,无论是需要感染时间信息或基于最终感染状态数据的方法,他们通过识别节点感染之间的频繁序列或统计相关性来确定节点之间的潜在影响关系。在一些现实环境中,如流行病的传播,由于成本高,追踪准确的感染时间往往是不可行的;即使获得节点的精确感染状态也是一项挑战性任务,得到的感染状态数据中一般会包含噪声数据,因为头痛等可观察症状只能部分揭示节点的真实状态。在现实环境中,往往只能得到关于节点感染状态的概率信息,而关于节点感染状态的概率信息无法直接用以计算统计相关性,因此需要新的方法来基于节点感染状态的概率信息推断传播网络中的影响关系。
技术实现思路
[0004]针对现有技术中存在的缺陷,本专利技术的在于提供一种面向噪声数据环境的传播网络结构重构方法及装置,基于节点感染状态的概率信息,推断出传播网络中节点之间的影响关系。
[0005]为
【技术保护点】
【技术特征摘要】
1.一种面向噪声数据环境的传播网络结构重构方法,其特征在于,包括步骤:获取传播网络中每个节点V
i
与其余节点的相关性;初始化传播网络的一个影响关系图G1={V,E1,W1},其中V表示组成传播网络的n个节点,E1表示G1中的有向边集合,W1表示G1中的有向边对应的权重集合;根据所述W1的权重数据对G1聚类,将权重大于设定值的节点列入候选父节点集合C
i
;利用C
i
使用分支限界策略找到每个节点的最优父节点集合F
i
;根据每个节点的F
i
更新边集合E1,返回更新得到的图G1。2.如权利要求1所述的面向噪声数据环境的传播网络结构重构方法,其特征在于:在所述计算传播网络中每个节点V
i
与其余节点的相关性,之前,所述方法包括:定义传播网络中潜在的影响关系图为G={V,E,W},其中V={V1,V2,
…
,V
n
}表示组成网络的n个节点;E是表示影响关系图中的有向边集合,W表示有向边上对应的权重集合;其中,从父节点V
i
∈V到子节点V
j
∈V的有向边(V
i
,V
j
)∈E表示:若节点V
i
被感染、V
j
节点未被感染,那么有p
ij
概率V
j
节点会被V
i
节点感染,其中p
ij
为感染传播概率;使用集合S={S1,S2,...,S
β
}来记录传播网络中β次传播过程结束后的概率信息,其中表示第l次传播过程结束后网络中n个节点的感染概率,表示第l次传播过程结束后节点V
i
的感染概率。3.如权利要求1所述的面向噪声数据环境的传播网络结构重构方法,其特征在于:所述获取传播网络中每个节点V
i
与其余节点的相关性,包括:计算其余各个节点V
j
∈V\{V
i
}与V
i
的相关性g(V
j
,V
i
):其中,X
i
∈[0,1]是节点V
i
的感染状态变量,α是变量X
i
和X
j
采样数据数目;Tr(.)是矩阵的迹,I是单位矩阵,在中,1是全1矩阵,表示矩阵,矩阵第a行第b列元素矩阵,矩阵第a行第b列元素其中<.>为内积函数;δ是一个双射{1,
…
,α}
→
{1,
…
,α},Δ
α
是包含所有双射的集合,(X
i
)
δ
是X
i
关于δ的置换版本。4.如权利要求1所述的面向噪声数据环境的传播网络结构重构方法,其特征在于:初始化传播网络的一个影响关系图G1={V,E,W1},包括:将G1中E1初始化为空集、W1初始化为节点间的g分数,其中g分数为g(V
j
,V
i
)的值。5.如权利要求1所述的面向噪声数据环境的传播网络结构重构方法,其特征在于,根据所述W1的权重数据对G1聚类,将权重大于设定值的节点列入候选父节点集合C
i
,包括:对W1中的权重数据使用K
‑
means方法进行聚类,得到至少两组元素;获取最大一组元素中的最小值t1,将G1中所述权重大于t1的有向边添加到E1;定义每个节点V
i
的候选父节点集合C
i
={V
j
|V
j
→
V
i
,V
j
∈V/{V
i
},g(V
j
,V
i
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。