当前位置: 首页 > 专利查询>武汉大学专利>正文

一种不依赖时间信息的传播网络结构重构方法技术

技术编号:17939708 阅读:23 留言:0更新日期:2018-05-15 20:06
本发明专利技术公开了一种不依赖时间信息的传播网络结构重构方法,首先根据收集到的结点感染状态数据来计算结点之间存在影响关系的概率以及影响关系的强弱,构造初始的影响关系图G1;然后利用Kmeans聚类方法将图G1中权重较小的边删除,即去除较弱的影响关系,得到影响关系图G2;通过计算结点之间直接影响的强弱来更新G2中每条边的权重,得到新的影响关系图G3;使用Dset方法找到图G3中影响强度过小的影响关系集合,即权重过小的边集合,删除G3中这些影响强度过小的边,得到最终的影响关系图G。本发明专利技术不需要收集传播过程中结点的感染时间就可以准确地确定结点之间的影响关系,减少了数据收集的工作量,从而能够快速有效的推断出社会网络中潜在的影响关系。

A reconstruction method of propagation network structure without time information

This invention discloses a method of network structure reconstruction without time information. First, the probability of the relationship between the nodes and the strength of the relationship are calculated according to the collected node infection state data. The initial influence relation graph G1 is constructed, and then the Kmeans clustering method is used to reduce the weight of the graph G1. Edge deletion, that is, to remove the weak influence relationship, get the influence relation map G2; update the weight of each edge in G2 by calculating the strength of the direct influence between the nodes to get a new influence relation diagram G3; use the Dset method to find the influence relation set which has too little intensity in the figure G3, that is, the weight too small edge set, delete the G3 For some edges with too little strength, the final influence diagram G is obtained. The invention does not need to collect the infection time of nodes in the communication process to accurately determine the relationship between nodes, reduce the workload of data collection, and thus can quickly and effectively infer the potential impact relationship in social networks.

【技术实现步骤摘要】
一种不依赖时间信息的传播网络结构重构方法
本专利技术属于信息传播领域,尤其涉及一种不依赖时间信息的传播网络结构重构方法。
技术介绍
信息传播是社会网络的一个基本过程,分析社会网络中的信息传播方式可以指导我们在现实生活中的一些工作。例如疾病传播是一种常见的信息传播方式,掌握疾病传播的流向可以帮助我们做好疾病的防控工作,减少损失。在分析信息传播的方式时,主要的目的是依据已记录的传播轨迹数据来对重构传播网络结构,也就是推断组成网络的各个结点之间潜在的影响关系,来帮助研究人员直观的理解这种潜在的影响关系,从而能够更好地促进或阻止将来的信息传播过程。已有的重构方法所利用的传播轨迹数据主要由网络中各结点在传播过程中的感染时间组成,认为在某一个时间段内感染的结点之间可能存在影响关系。但是结点的感染时间信息在许多自然传播过程中却难以收集,例如疾病传播,因为在流行病传播过程中要频繁地定期对患病情况进行全面的调查是费时和昂贵的。与收集结点确切的感染时间相比,观察每个节点的最终感染状态更为现实。而感染状态无法直接反映结点之间的影响关系,因而需要新的方法来基于结点的感染状态数据推断传播网络中的影响关系。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种不依赖时间信息的传播网络结构重构方法。基于网络中各节点在传播过程结束之后的感染状态数据,首先利用统计方法来揭示结点之间潜在的影响关系,然后计算结点之间的影响程度来对已有的影响关系进行修正,从而确定最终的影响关系图。本专利技术所采用的技术方案是:一种不依赖时间信息的传播网络结构重构方法,其特征在于:定义传播网络中潜在的影响关系图为G={V,E,W},其中V={V1,V2,...,Vn}表示组成网络的n个结点;E是表示影响关系图中的有向边集合,若结点Vi能够影响结点Vj,则在影响关系图上存在一条从Vi指向Vj的有向边;W表示有向边上对应的权重集合;使用集合S={S1,S2,...,Sβ}来记录网络中β次传播过程结束后的结果,其中表示第l次传播过程结束后网络中n个结点的感染状态,表示第l次传播过程结束后结点Vi的感染状态,表示第l次传播过程结束后结点Vi被感染,表示第l次传播后结点Vi没有被感染,1≤i≤n,1≤l≤β;基于上述定义,所述方法包括以下步骤:步骤1:依次考虑网络中的每个结点Vi,计算V除去Vi后剩余结点组成的集合{Vj|Vj∈V,Vj≠Vi}中每个结点Vj是Vi的父节点的概率Ppa(Vi|Vj);步骤2:对于网络中的任意两个结点Vi和Vj,计算他们之间的修正互信息ModifiedMulInfo(Vi,Vj);步骤3:根据父节点的概率和修正互信息构造图G1;步骤4:删除图G1中权重小于t1的边得到图G2;步骤5:更新图G2中所有边的权重,得到图G3;步骤6:删除图G3中权重小于t2的边得到最终影响关系图。本专利技术具有如下优点:不需要记录信息传播过程中每个结点的感染时间,减少了数据收集的工作量;提出了新的方法来根据感染状态数据准确地推断出结点之间的影响关系。附图说明图1是本专利技术实施例的流程图;图2是本专利技术实施例在LFR算法生成的人工网络上构建影响关系图对应F值的结果图;图3是本专利技术实施例在Poster网络上使用不同数目的传播轨迹数据构建影响关系图对应的F值的结果图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。在本实施例中,使用了六个网络(如表1所示),其中网络Net1,Net2,Net3,Net4和Net5是采用LFR算法生成的人工网络,Poster是一个表示科学家研究工作的合作关系网络,其中结点表示科学家,边表示两个科学家之间存在合作关系。每个网络的传播数据生成过程如下:假定网络中各个结点之间的影响程度相同,每次传播过程中,从测试网络中随机选择15%的结点作为初始“感染”点,并根据IC模型进行传播模拟,在传播模拟结束后,记录每个结点的感染状态作为一条传播轨迹数据,并生成多条数据作为实验的观测数据集。表1实验网络结点个数边数Net1100800Net21501200Net32001600Net42502000Net53002400Poster3791602图1中描述了本专利技术实施例的流程图,本专利技术提供的一种不依赖时间信息的传播网络结构重构方法,定义传播网络中潜在的影响关系图为G={V,E,W},其中V={V1,V2,...,Vn}表示组成网络的n个结点;E是表示影响关系图中的有向边集合,若结点Vi能够影响结点Vj,则在影响关系图上存在一条从Vi指向Vj的有向边;W表示有向边上对应的权重集合;使用集合S={S1,S2,...,Sβ}来记录网络中β次传播过程结束后的结果,其中表示第l次传播过程结束后网络中n个结点的感染状态,表示第l次传播过程结束后结点Vi的感染状态,表示第l次传播过程结束后结点Vi被感染,表示第l次传播后结点Vi没有被感染,1≤i≤n,1≤l≤β;基于上述定义,所述方法包括以下步骤:步骤1:依次考虑网络中的每个结点Vi,计算V除去Vi后剩余结点组成的集合{Vj|Vj∈V,Vj≠Vi}中每个结点Vj是Vi的父节点的概率Ppa(Vi|Vj):其中,xi,xj∈{0,1}表示感染状态;β表示传播过程的次数;和分别表示第l次传播过程结束后结点Vi和Vj的感染状态;I(.)表示一个指示函数,当(.)成立时函数取值为1,不成立时函数取值为0。步骤2:对于网络中的任意两个结点Vi和Vj,计算他们之间的修正互信息ModifiedMulInfo(Vi,Vj):其中,β表示传播过程的次数;和分别表示第l次传播过程结束后结点Vi和Vj的感染状态;I(.)表示一个指示函数,当(.)成立时函数取值为1,不成立时函数取值为0。步骤3:初始化一个有向图G1={V,E1,W1},其中V表示组成网络的n个结点,E1和W1表示G1中的有向边集合和有向边对应的权重集合,初始时都为空集。对于每个结点Vi,选择是Vi父结点概率最大的p个结点组成集合Pa1_i,构造一个边集合{Vj->Vi|Vj∈Pa1_i},将这些边添加到G1中,即E1=E1∪{Vj->Vi|Vj∈Pa1_i},并将有向边上的权重设置为这两个结点之间的修正互信息;其中p∈(1,n)。步骤4:对W1中的权重数据使用K-means方法进行聚类,聚类个数设置为2。对于聚类后的两组元素,假设t1为较小一组元素中的最大值,将G1中权重小于t1的边删除,将G1中剩余边组成的图记为G2={V,E2,W2}。步骤5:对于每一个结点Vi,在图G2中找到Vi的父结点集合Pa2_i={Vj|Vj->Vi∈E2},同时将Pa2_i中每个结点在第l次传播过程结束后的感染状态记录到集合更新G2中的每一条边的权重,将G2更新权重后得到的图记为G3={V,E3,W3}。更新权重的计算方式为:其中newWeight(Vj,Vi)表示G2中的边Vj->Vi更新后的权重;β表示传播过程的次数;和分别表示第l次传播过程结束后结点Vi和Vj的感染状态;Pa2_i表示结点Vi在图G2中的父结点集合;表示第l次传播后Pa2_i中每个结点的感染状态本文档来自技高网...
一种不依赖时间信息的传播网络结构重构方法

【技术保护点】
一种不依赖时间信息的传播网络结构重构方法,其特征在于:定义传播网络中潜在的影响关系图为G={V,E,W},其中V={V1,V2,...,Vn}表示组成网络的n个结点;E是表示影响关系图中的有向边集合,若结点Vi能够影响结点Vj,则在影响关系图上存在一条从Vi指向Vj的有向边;W表示有向边上对应的权重集合;使用集合S={S1,S2,...,Sβ}来记录网络中β次传播过程结束后的结果,其中

【技术特征摘要】
1.一种不依赖时间信息的传播网络结构重构方法,其特征在于:定义传播网络中潜在的影响关系图为G={V,E,W},其中V={V1,V2,...,Vn}表示组成网络的n个结点;E是表示影响关系图中的有向边集合,若结点Vi能够影响结点Vj,则在影响关系图上存在一条从Vi指向Vj的有向边;W表示有向边上对应的权重集合;使用集合S={S1,S2,...,Sβ}来记录网络中β次传播过程结束后的结果,其中表示第l次传播过程结束后网络中n个结点的感染状态,表示第l次传播过程结束后结点Vi的感染状态,表示第l次传播过程结束后结点Vi被感染,表示第l次传播后结点Vi没有被感染,1≤i≤n,1≤l≤β;基于上述定义,所述方法包括以下步骤:步骤1:依次考虑网络中的每个结点Vi,计算V除去Vi后剩余结点组成的集合{Vj|Vj∈V,Vj≠Vi}中每个结点Vj是Vi的父节点的概率Ppa(Vi|Vj);步骤2:对于网络中的任意两个结点Vi和Vj,计算他们之间的修正互信息ModifiedMulInfo(Vi,Vj);步骤3:根据父节点的概率和修正互信息构造图G1;步骤4:删除图G1中权重小于t1的边得到图G2;步骤5:更新图G2中所有边的权重,得到图G3;步骤6:删除图G3中权重小于t2的边得到最终影响关系图。2.根据权利要求1所述的不依赖时间信息的传播网络结构重构方法,其特征在于,步骤1中:其中,xi,xj∈{0,1}表示感染状态;β表示传播过程的次数;和分别表示第l次传播过程结束后结点Vi和Vj的感染状态;I(.)表示一个指示函数,当(.)成立时函数取值为1,不成立时函数取值为0。3.根据权利要求1所述的不依赖时间信息的传播网络结构重构方法,其特征在于,步骤2中:其中,β表示传播过程的次数;和分别表示第l次传播过程结束后结点Vi和Vj的感染状态;I(.)表示一个指示函数,当(.)成立时函数取值为1,不成立时函数取值为0。4.根据权利要求1所述的不依赖时间信息...

【专利技术属性】
技术研发人员:黄浩马琳颜钱李宗鹏
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1