当前位置: 首页 > 专利查询>湖南大学专利>正文

一种实现影响力最大化的初始节点选取方法和系统技术方案

技术编号:21899000 阅读:43 留言:0更新日期:2019-08-17 18:26
本发明专利技术公开了一种实现影响力最大化的初始节点选取方法,其针对社交网络中多种影响同时传播的场景,将从众意识引入传播过程中,针对从众意识的传播模型提出了逆向采用采样方法、初始节点选取方法和初始节点估计方法,首先对影响网络进行逆向采用采样,随后根据逆向采用采样的样本,迭代地计算初始节点,直到采用估计方法判断采用收益满足精度要求为止,否则加倍采样规模,重复以上步骤。从众意识的传播模型更加科学和真实地建模传播过程,初始节点选取方法能够准确、高效地选取初始节点,并能够适应大规模网络结构,提高了初始节点选取方法的时效性。

An Initial Node Selection Method and System for Maximizing Impact

【技术实现步骤摘要】
一种实现影响力最大化的初始节点选取方法和系统
本专利技术属于计算机信息
,更具体地,涉及一种实现影响力最大化的初始节点选取方法和系统。
技术介绍
互联网的发展不仅为人类提供了便利的生活,更改变了人类生活和工作方式。随着Facebook、微博等网络应用兴起和移动网络终端的普及,在线社交网络将分散在不同地域、拥有不同信仰、隶属于不同国家和组织的人们连接在一起,形成一个巨大的信息交通网络。大规模的社交网络的信息传播蕴含着巨大的经济与社会价值(如可用于广告营销和政策推广),因此如何选取初始节点以实现影响力最大化(Influencemaximization,简称IM),已经成为社交网络
一个重要的研究问题。现有的初始节点选择方法主要是基于独立级联(Independentcascade,简称IC)模型或者线性阈值(Linearthreshold,简称LT)模型,其使用基于仿真模拟的方法、启发式的方法或逆向影响采样的方法来确定初始节点的影响。然而,现有的初始节点选择方法所使用的模型仍然具有不可忽略的技术问题:由于其没有考虑从众行为,使得建立的模型不够真实,因而获取的影响值不够精确,最终导致选择的初始节点不够理想。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种实现影响力最大化的初始节点选取方法和系统,其目的在于,解决现有初始节点选择方法所采用的模型由于没有考虑从众行为,使得建立的模型不够真实,导致获取的影响值不够精确、选择的初始节点不够理想的技术问题;此外,本专利技术中提出的传播模型增强传播模型的真实性和科学性,也提升了传播模型的适用范围;最后,本专利技术中提出的初始节点选择方法提高了初始节点选择方法的时效性。为实现上述目的,按照本专利技术的一个方面,提供了一种实现影响力最大化的初始节点选取方法,包括以下步骤:(1)根据建立好的传播模型构建影响图,并根据构建的影响图生成初始节点集SC,用于传播其他有竞争关系的影响;(2)根据预设的精度参数ε和δ,利用SSA算法获取阈值T0,对(1)中获得的影响图进行T0次逆向采用采样,并将所有采样获得的T0个样本放入样本集合中;(3)依据步骤(2)中返回的样本集合迭代地从影响图中选择k个采用边缘收益最大的节点作为初始节点集,并获得初始节点集S的采用的有偏估计其中0<k<n;(4)设置计数器c10=0,用于表示执行步骤(5)逆向采用采样的次数,并设置步骤(3)中获得的初始节点集S的总采用SUM2=0;(5)对影响图进行逆向采用采样,计算步骤(3)中获得的初始节点集S在本次采样中获得的采用Ac10,并更新步骤(3)中获得的初始节点集S的总采用SUM2=SUM2+Ac10;(6)判断计数器c10是否小于阈值T2且初始节点集S的总采用SUM2是否小于阈值T3,如果是则设置c10=c10+1,并返回步骤(5),否则输出并进入步骤(7);(7)判断步骤(3)中获得的初始节点集S的有偏估计与步骤(6)中获得的初始节点集S的无偏估计是否满足如果满足,则直接输出初始节点集S作为结果,过程结束,否则更新步骤(2)中使用的采样次数T0=2*T0,并返回步骤(2)。优选地,影响图被表示为G=(V,E,p),其中V表示节点的集合,E表示有向边的集合,p表示所有边被预先分配的激活概率的函数,每条边具有一个预先分配的激活概率p(u,v)∈[0,1],表示节点u激活节点v的概率。优选地,传播模型的传播过程如下:首先,在0时刻,不同的影响激活各自的初始节点,以启动传播过程。不同的影响可选择相同的节点作为初始节点;然后,在t时刻,已经在t-1时刻被激活的节点在此时变为已激活状态,并尝试激活未被激活的邻居节点,如果激活尝试成功,被激活的节点将接收激活节点的所有影响,如果激活尝试未成功,则未被激活的节点保持未激活状态,在此之后,处于已激活状态的节点将依照从众的采用函数所定义的概率,采用其接收的影响中的一种,并最终变成已采用状态;从众的采用函数h(u,I)定义概率如下:其中,h(u,Ii)表示节点u采用影响Ii的概率,是所有影响构成的集合,NA(u,Ii)表示激活了节点u且向其传播了影响Ii的邻居节点。最后,传播过程在没有新的节点被激活时终止。步骤(2)中的样本是单次逆向采用采样获得的数据,并包括节点集合R、节点集合R中每个节点w与其他节点之间距离的集合{d(u)|u∈R}、节点集合R中每个节点的激活节点集的集合{NA(u)|u∈R}、节点w与初始节点集SC的距离dC与节点w被初始节点集SC中节点所传播的影响激活的总次数TimeC。优选地,步骤(2)中单次逆向采用采样的过程包括以下子步骤:(2-1)从影响图中随机地选择一个节点w,设置节点w与自身的距离d(wc1)=0,将w放入节点集合R中,并设置初始节点集合SC与节点w的距离dC=∞,设置变量curDist=0,curDist表示当前处理的节点与节点w的距离,简称当前距离;(2-2)判断该节点w是否是初始节点集SC中的元素,如果是,则记录节点w被竞争影响激活的总次数TimeC和初始节点集合SC与节点w的距离dc=0,转入步骤(2-17),否则进入步骤(2-3);(2-3)设置计数器c1=1,当前距离curDist=curDist+1,判断c1值是否大于节点w的入邻居节点总数,如果是,则转入步骤(2-17),否则转入步骤(2-4);(2-4)根据节点w的第c1个入邻居节点wc1激活节点w的概率判定节点wc1激活节点w是否成功,如果是,则记录节点wc1与节点w的距离d(wc1)=curDist,将节点wc1放入其激活节点集NA(wc1),将节点wc1放入节点集合V中,并转入步骤(2-5),否则转入步骤(2-6);(2-5)判断该节点wc1是否是初始节点集SC中的元素,如果是则将初始节点集合SC与节点w的距离dC设置为当前距离curDist,并转入步骤(2-6),否则转入步骤(2-6);(2-6)判断c1值是否等于节点w的入邻居节点总数,如果是,则转入步骤(2-8),否则转入步骤(2-7);(2-7)设置计数器c1=c1+1,并返回步骤(2-4);(2-8)判断节点集合V与初始节点集SC是否有交集,或者节点集合V是否为空集,如果是,则计算并记录节点w被节点集合V与SC交集中节点所传播的竞争影响激活的总次数TimeC,并转入步骤(2-17),否则将节点集合V中的所有节点放入节点集合R中,并转入步骤(2-9);(2-9)设置计数器c2=1,以及当前距离curDist=curDist+1;(2-10)从节点集合V中选择第c2个节点wc2,并设置计数器c3=1,判断计数器c3的值是否大于节点wc2的入邻居节点总数,如果是,则转入步骤(2-14),否则转入步骤(2-11);(2-11)判断节点wc3是否不在节点集合R中,且根据节点wc2的第c3个入邻居节点wc3激活节点wc2的概率判定节点wc3激活节点wc2是否成功,如果是,则设置节点wc3与节点w的距离d(wc3)等于curDist,将节点wc2的激活节点集NA(wc2)中的元素放入节点wc3激活节点集NA(wc3)中,将节点wc3放入节点集合Vnext中,并转入步骤(2-12),否则转入步骤(2-本文档来自技高网...

【技术保护点】
1.一种实现影响力最大化的初始节点选取方法,其特征在于,包括以下步骤:(1)根据建立好的传播模型构建影响图,并根据构建的影响图生成初始节点集SC,用于传播其他有竞争关系的影响;(2)根据预设的精度参数ε和δ,利用SSA算法获取阈值T0,对(1)中获得的影响图进行T0次逆向采用采样,并将所有采样获得的T0个样本放入样本集合

【技术特征摘要】
1.一种实现影响力最大化的初始节点选取方法,其特征在于,包括以下步骤:(1)根据建立好的传播模型构建影响图,并根据构建的影响图生成初始节点集SC,用于传播其他有竞争关系的影响;(2)根据预设的精度参数ε和δ,利用SSA算法获取阈值T0,对(1)中获得的影响图进行T0次逆向采用采样,并将所有采样获得的T0个样本放入样本集合中;(3)依据步骤(2)中返回的样本集合迭代地从影响图中选择k个采用边缘收益最大的节点作为初始节点集S,并获得初始节点集S的采用的有偏估计其中0<k<n;(4)设置计数器c10=0,并设置步骤(3)中获得的初始节点集S的总采用SUM2=0;(5)对影响图进行逆向采用采样,计算步骤(3)中获得的初始节点集S在本次采样中获得的采用Ac10,并更新步骤(3)中获得的初始节点集S的总采用SUM2=SUM2+Ac10;(6)判断计数器c10是否小于阈值T2且初始节点集S的总采用SUM2是否小于阈值T3,如果是则设置c10=c10+1,并返回步骤(5),否则输出并进入步骤(7),其中n表示影响图中的节点总数;(7)判断步骤(3)中获得的初始节点集S的有偏估计与步骤(6)中获得的初始节点集S的无偏估计是否满足如果满足,则直接输出初始节点集S作为结果,过程结束,否则更新步骤(2)中使用的采样次数T0=2*T0,并返回步骤(2),其中ε1表示权值。2.根据权利要求1所述的初始节点选取方法,其特征在于,影响图被表示为G=(V,E,p),其中V表示节点的集合,E表示有向边的集合,p表示所有边被预先分配的激活概率的函数,每条边具有一个预先分配的激活概率p(u,v)∈[0,1],表示节点u激活节点v的概率。3.根据权利要求1所述的初始节点选取方法,其特征在于,传播模型的传播过程如下:首先,在0时刻,不同的影响激活各自的初始节点,以启动传播过程。不同的影响可选择相同的节点作为初始节点;然后,在t时刻,已经在t-1时刻被激活的节点在此时变为已激活状态,并尝试激活未被激活的邻居节点,如果激活尝试成功,被激活的节点将接收激活节点的所有影响,如果激活尝试未成功,则未被激活的节点保持未激活状态,在此之后,处于已激活状态的节点将依照从众的采用函数所定义的概率,采用其接收的影响中的一种,并最终变成已采用状态。从众的采用函数h(u,Ii)定义概率如下:其中,h(u,Ii)表示节点u采用影响Ii的概率,是所有影响构成的集合,NA(u,Ii)表示激活了节点u且向其传播了影响Ii的邻居节点;最后,传播过程在没有新的节点被激活时终止。4.根据权利要求1所述的初始节点选取方法,其特征在于,步骤(2)中的样本是单次逆向采用采样获得的数据,并包括节点集合R、节点集合R中每个节点w与其他节点之间距离的集合{d(u)|u∈R}、节点集合R中每个节点的激活节点集的集合{NA(u)|u∈R}、节点w与初始节点集SC的距离dC与节点w被初始节点集SC中节点所传播的影响激活的总次数TimeC。5.根据权利要求1至4中任意一项所述的初始节点选取方法,其特征在于,步骤(2)中单次逆向采用采样的过程包括以下子步骤:(2-1)从影响图中随机地选择一个节点w,设置节点w与自身的距离d(wc1)=0,将w放入节点集合R中,并设置初始节点集合SC与节点w的距离dC=∞,设置变量curDist=0,curDist表示当前处理的节点与节点w的距离,简称当前距离;(2-2)判断该节点w是否是初始节点集SC中的元素,如果是,则记录节点w被竞争影响激活的总次数TimeC和初始节点集合SC与节点w的距离dc=0,转入步骤(2-17),否则进入步骤(2-3);(2-3)设置计数器c1=1,当前距离curDist=curDist+1,判断c1值是否大于节点w的入邻居节点总数,如果是,则转入步骤(2-17),否则转入步骤(2-4);(2-4)根据节点w的第c1个入邻居节点wc1激活节点w的概率判定节点wc1激活节点w是否成功,如果是,则记录节点wc1与节点w的距离d(wc1)=curDist,将节点wc1放入其激活节点集NA(wc1),将节点wc1放入节点集合V中,并转入步骤(2-5),否则转入步骤(2-6);(2-5)判断该节点wc1是否是初始节点集SC中的元素,如果是则将初始节点集合SC与节点w的距离dC设置为当前距离curDist,并转入步骤(2-6),否则转入步骤(2-6);(2-6)判断c1值是否等于节点w的入邻居节点总数,如果是,则转入步骤(2-8),否则转入步骤(2-7);(2-7)设置计数器c1=c1+1,并返回步骤(2-4);(2-8)判断节点集合V与初始节点集SC是否有交集,或者节点集合V是否为空集,如果是,则计算并记录节点w被节点集合V与SC交集中节点所传播的竞争影响激活的总次数TimeC,并转入步骤(2-17),否则将节点集合V中的所有节点放入节点集合R中,并转入步骤(2-9);(2-9)设置计数器c2=1,以及当前距离curDist=curDist+1;(2-10)从节点集合V中选择第c2个节点wc2,并设置计数器c3=1,判断计数器c3的值是否大于节点wc2的入邻居节点总数,如果是,则转入步骤(2-14),否则转入步骤(2-11);(2-11)判断节点wc3是否不在节点集合R中,且根据节点wc2的第c3个入邻居节点wc3激活节点wc2的概率判定节点wc3激活节点wc2是否成功,如果是,则设置节点wc3与节点w的距离d(wc3)等于curDist,将节点wc2的激活节点集NA(wc2)中的元素放入节点wc3激活节点集NA(wc3)中,将节点wc3放入节点集合Vnext中,并转入步骤(2-12),否则转入步骤(2-13);(2-12)判断节点wc3是否是初始节点集SC中的元素,如果是则设置初始节点集合SC与节点w的距离dC等于curDist,并转入步骤(2-13),否则直接转入步骤(2-13);(2-13)判断计数器c3的值是否大于节点wc2的入邻居节点总数,如果是,则转入步骤(2-14),否则设置计数器c3=c3+1,并返回步骤(2-11);(2-14)判断计数器c2值是否等于节点集合V中的节点总数,如果是则进入步骤(2-15),否则设置计数器c2=c2+1,并返回步骤(2-10);(2-15)判断节点集合Vnext与初始节点集SC是否有交集,或者节点集合Vnext是否为空集,如果是,则获取节点w被节点集合Vnext与SC交集中节点所传播的竞争影响激活的总次数TimeC,并转入步骤(2-17),否则转入步骤(2-16);(2-16)用节点集合Vnext中的所有节点替换节点集合V中的所有节点,并将节点集合V中的所有节点放入节点集合R中,并返回步骤(2-8);(2-17)获取节点集合R、节点集合R中每个节点与节点w之间的距离的集合{d(u)|u∈R}、节点集合R中每个节点的激活节点集的集合{NA(u)|u∈R}、节点w与初始节点集SC的距离dC、以及节点w被初始节点集SC中节点所传播的影响激活的总次数TimeC。6.根据权利要求1至5中任意一项所述的初始节点选取方法,其特征在于,步骤(3)中迭代地选择k个采用边缘收益最大的节点作为初始节点集的过程包括以下子步骤:(3-1)设置设置计数器c4=1,设置影响图中各个节点在样本集合上的总采用的初始值均为0,初始节点集S在样本集合上的采用的总和SUM1=0;(3-2)设置计数器c5=1;(3-3)从样本集合中取出第c5个样本Rc5,设置计数器c6=1;(3-4)从样本Rc5中取出第c6个节点wc6,判断在Rc5中节点wc6与节点w的距离d(wc6)是否小于dC,如果是,则设置节点wc6在Rc5上的采用为1,节点wc6的总采用加1,然后转入步骤(3-5);否则,设置节点wc6在Rc5上的采用为更新wc6在样本集合上的总采用为节点wc6在样本集合上的总采用加上然后转入步骤(3-5);其中NA(wc6)和TimeC是分别表示样本Rc5中的激活节点集和初始节点集SC中节点所传播的影响激活样本Rc5中的节点w的总次数。(3-5)判断计数器c6是否小于|Rc5|,如果是,则设置c6=c6+1,然后返回步骤(3-4),否则转入步骤(3-6);(3-6)判断计数器c5是否小于如果是,则设置c5=c5+1,并返回步骤(3-3),否则转入步骤(3-7);(3-7)利用大根堆对影响图中所有节点依据每个节点在上的总采用的大小进行降序排列;(3-8)判断计数器C4是否小于预设阈值k,如果是,则取出在上的总采用最大的节点wc4,将节点wc4加入初始节点集S,设置SUM1=SUM1+A(wc4),其中A(wc4)为节点wc4在上的总采用,并从大根堆中删除节点wc4,并转到步骤(3-9),否则获得初始节点集合S与其采用的有偏估计然后转入步骤(3-22)。(3-9)从样本集合中取出所有包含节点wc4的样本,形成样本集合并设置计数器c7=1;(3-10)取出中的第c7个样本Rc7,并判断样本Rc7是否被标记为确定采用,如果是则转到步骤(3-21),否则转到步骤(3-11);(3-11)判断wc4与样...

【专利技术属性】
技术研发人员:周旭刘勇刚姜文君肖国庆罗文晟李肯立李克勤
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1