The invention discloses a method for determining the maximum for a group, first of all to the group's history \infection\ of the data collected, the same within the group as \infected\ the same probability of random variables (i.e. homogeneity), calculate the complete probability space of D set X in homogeneity assumption the groups in the historical data, the conditional probability of independent groups and the associated structural description of the calculation of entropy to construct a graph IG, then use the greedy algorithm in graph IG through calculation of the scope to select the influence range of maximum size k seed set S; the invention does not depend on the point of impact the relationship between the acquisition can quickly locate the most influential group of seed set, and when the number of groups in the network is far less than the number of points, this method is compared with the general algorithm more efficient and more accurate Indeed.
【技术实现步骤摘要】
一种面向团体的影响最大化方法
本专利技术属于信息传播领域,尤其涉及一种面向团体的影响最大化方法。
技术介绍
互联网的快速发展促使形成了一种可观测的社会网络,为研究信息传播,疾病扩散等现象提供了极大的便利,同时在舆情控制、电视营销、疾病预防等应用的驱动下,如何从给定网络中寻找一组有限子集,并根据影响的级联传递,使得该子集的影响最大化的问题受到了广泛的关注。目前关于影响最大化的研究对象主要聚焦于实体点(如个人或博客),通过这些实体点的影响关系,设计相关的算法搜索具有最大影响力的k-点组合。但是,在现实生活中,人们的更加趋向于分析团体(如社区或各类人群)组合的影响力,来对即将实施的行为做出指导。一个团体的影响力通常视为其内所有“感染”(如采纳谣言或购买产品)点的影响力之和。团体间的影响本质上是团体间点的影响,但在基于团体粒度上的影响最大化分析,导致了点影响关系的不可见,从而使得团体间影响存在不确定性,同时团体作为点的集合可能被多个邻居同时影响并且状态为连续取值,使得在动态模拟团体影响传递时需要建立更加复杂的规则来计算影响大小。所以,在基于团体粒度上的影响最大化分析时,如何表达团体的不确定性影响并描述团体影响传递过程是关键与难点。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种面向团体影响最大化方法。通过使用概率关联的形式描述团体影响的不确定性,并通过对团体历史“感染”数据进行统计计算得到团体影响的量值。本专利技术所采用的技术方案是:一种面向团体的影响最大化确定方法,其特征在于,定义团体集M的每一个团体mi对应的点集为mi(x),从每个mi(x)中选择一个点 ...
【技术保护点】
一种面向团体的影响最大化确定方法,其特征在于,定义团体集M的每一个团体m
【技术特征摘要】
1.一种面向团体的影响最大化确定方法,其特征在于,定义团体集M的每一个团体mi对应的点集为mi(x),从每个mi(x)中选择一个点组成点集X,记X={x1,...,x|M|};在疾病cl下,X中任一点xi的是否被感染认为是cl对xi的不确定性影响造成的,记xi感染cl的概率为pl(xi),未感染cl的概率为1-pl(xi);步骤1:设定阈值ε,使用团体集M构造一个以团体为结点的完全图IG*(M,I,W);然后在概率空间D上计算点集X中任意两个点xi、xj的互信息熵Inf(xi,xj),并根据Inf(xi,xj)和阈值ε阈比较结果选择:若Inf(xi,xj)<ε,说明xi、xj对应的团体mi、mj不存在关联,则直接从图IG*(M,I,W)中删去边Ii,j;若Inf(xi,xj)≥ε,则计算xi、xj的条件概率独立程度ind(xi,xj)来判断关联类型:若ind(xi,xj)=0,则xi、xj对应的团体mi、mj不存在直接关联,直接从图IG*(M,I,W)中删除边Ii,j;如果ind(xi,xj)>0,说明xi、xj对应的团体mi、mj存在直接关联,则将图IG*(M,I,W)中的边Ii,j的权值设置为wij=ind(xi,xj);将删除IG*(M,I,W)中所有无关联的边后得到图记为IG(M,I,W);X中任意两个点xi、xj的条件概率独立程度的具体计算为:其中ε为给定的阈值;Inf((xi,xj)|(X-(xi,xj)))为xi和xj关于{X-(xi,xj)}的条件互信息熵;步骤2:初始化一个空集S作为种子集;对于团体集合M中的每一个团体mi,以S∪mi作为备选种子,计算S∪mi的影响范围σ(S∪mi),选取边际影响收益σ(S∪mi)-σ(S)最大的mi加入S并从团体集合M中删除该团体,重复此过程直到种子集S的大小达到预设的大小k;每个网络中不同k值得到的种子集S的影响范围函数σ(S)的计算为:
【专利技术属性】
技术研发人员:黄浩,张平,颜钱,李宗鹏,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。