当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于多层潜力和社区结构的影响最大化方法技术

技术编号:14884248 阅读:83 留言:0更新日期:2017-03-24 22:44
本发明专利技术涉及一种基于多层潜力和社区结构的影响最大化方法,方法假设影响力的传播分为两个阶段,第一阶段:社区间基于多层潜力的种子扩算;第二阶段:社区内的影响传播;在第一阶段,种子节点v尝试激活其处于未激活状态的邻居节点{u|u∈N(v),active(u)=0},此过程中被激活的节点记为S1,则有其中N(S)=∪v∈SN(v),接下来,S1又会尝试激活其处于未激活状态邻居节点{u|u∈N(S1)\S,active(u)=0},此过程中被激活的节点记为S2;在第二阶段,将节点影响的范围限制在其所在的社区中,对任意的社区该社区最终产生的影响规模取决于两个因素:1)社区Ci的大小|Ci|,2)S2的节点落在该社区的个数|S2∩Ci|。本发明专利技术提出的基于多层潜力和社区结构的影响最大化方法,其效率不仅比已有最新的算法(如IPA算法)高,而且其准确性也高于IPA算法及其他启发式算法。

【技术实现步骤摘要】

本专利技术属于计算机数据挖掘领域,具体涉及一种利用社区结构快速求解影响最大化问题的方法,尤其涉及大规模网络中的影响最大化求解问题。
技术介绍
影响最大化(InfluenceMaximization)是一个关于传播的优化问题。不论是某个公司的新产品或者某种理念的有效推广,还是对某种病毒或者灾害的有效控制,等一些其他同类型的问题,都避免不了考虑这样的一个问题,如何用有限的资源达到最好的效果。抽象为数学语言即为:对给定的网络G(V,E,W),(其中V代表图中的节点集合,E代表图中边的集合,W是从边集E的边到节点集V的节点对的映射所对应的权值)在V中寻找k个种子节点组成的集合S,在某种扩散模型下,最终的传播范围最广,即使得V中影响的节点数目σ(S)最大。由此可见,影响最大化的研究,具有很强的现实应用背景。在经典的LT(LinearThreshold)和IC(IndependentCascade)传播模型下,[1]不仅证明了影响最大化问题是NP-C问题,影响最大化函数σ(S)是次模函数,而且还提出了结合次模的贪心算法来解决此问题。该算法在理论上至少保证可达到最优目标的(1-1/e-ε)。其中,e是自然对数,ε是任意小的正整数。简单的说,结合次模的贪心算法至少达到对应最优目标的63%。(次模函数定义为:设集合对都有σ(U∪v)-σ(U)≥σ(T∪v)-σ(T),σ(S)≤σ(T)。也就是说,如果σ(·)是一个有限集合到非负整数的映射,且满足递增且边界递减效应,则σ(·)是次模函数)由于其算法的时间复杂度,导致其很难适应于大型网络。随后的研究主要分为,对已有模型下提出最适用的算法和通过现实建模并构建出新的传播模型。有的现有技术结合次模特性,在独立级联模型下提出了CELF算法,很大程度上降低了原算法的时间复杂度。在此基础上,进而又提出了CELF++算法,时间复杂度提高30%~50%。但是由于上述算法,在每次迭代过程中均要多次蒙特卡洛模拟产生的平均值作为影响力,时间复杂度相对比较高,导致其还是很难应用于目前很多的大型网络。基于此,很多启发式算法应运而生。一个直观而又简单的想法是,选择k个度最大的节点,其中正是利用了此想法,但在每步选择“未覆盖”的节点中选择度最大的。当一个节点被选择,它的邻居节点被标记为“覆盖”。由于其标记“覆盖”的过程中也直接将激活和覆盖等同,导致实验效果并不理想。有人提出了改进的Degree-Discount算法来进行初始节点的选择,和CELF算法不同的是,当一个节点被选择,其邻居节点的度减1,然后再此基础上选择度数最大的节点。然而它并不能解决将种子节点均衡分配到网络中的任务。随后结合种子节点的度和潜力提出了启发式算法和贪心算法相结合的选择策略,该类方法,不仅考虑各个节点的度和潜力值,还要根据不同网络选择用启发算法选择的种子节点的比率,导致实验结果不太好控制。近些年也出现了基于社区影响最大化的研究。其中定义社区结构为一种相似性结构,即社区内部链接紧密而社区之间链接稀疏。基于此,很多研究就用节点在该社区内的影响近似在整个网络的影响,极大的缩小了时间复杂度。改进的k-means聚类算法将整个网络聚类为k个社区,基于处于同一社区的相似性高,不同社区的相似性小的特性,从而在各个社区中选取处于中心的节点(社区影响力较大的节点),构成初始种子节点集合S。这也导致忽略了社区间的差别,直接将各个社区看作同等地位,导致近似的误差性过大。AMICS算法是根据已有的社区挖掘算法识别出社区结构,然后选择跨社区最多的k个节点,作为初始种子节点集合S。实验表明在小型或中等网络结构中有不错的效果,也是没有考虑到社区间的区别。其中一种现有技术,首先是利用提出的HClustering算法检测社区,然后利用网络拓扑结构选取候种子节点,最后在候选种子中选取种子节点。该算法并没有在已有的独立级联模型或者线性阈值模型下验证。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于多层潜力和社区结构的影响最大化方法。本专利技术的目的是通过以下技术方案来实现的,一种基于多层潜力和社区结构的影响最大化方法,其特征在于:包括两个阶段,第一阶段:社区间基于多层潜力的种子扩算;第二阶段:社区内的影响传播;在第一阶段,种子节点v尝试激活其处于未激活状态的邻居节点{u|u∈N(v),active(u)=0本文档来自技高网
...
一种基于多层潜力和社区结构的影响最大化方法

【技术保护点】
一种基于多层潜力和社区结构的影响最大化方法,其特征在于:包括两个阶段,第一阶段:社区间基于多层潜力的种子扩算;第二阶段:社区内的影响传播;在第一阶段,种子节点v尝试激活其处于未激活状态的邻居节点{u|u∈N(v),active(u)=0},此过程中被激活的节点记为S1,则有其中N(S)=∪v∈SN(v),接下来,S1又会尝试激活其处于未激活状态邻居节点{u|u∈N(S1)\S,active(u)=0},此过程中被激活的节点记为S2;在第二阶段,将节点影响的范围限制在其所在的社区中,对任意的社区影响规模取决于两个因素:1)社区Ci的大小|Ci|,2)S2的节点落在该社区的个数|S2∩Ci|,当|Ci|和|S2∩Ci|越大时,该社区的影响范围就越大;当|Ci|>>|S2∩Ci|时,该社区的影响取决于|S2∩Ci|的值;当|Ci|≈|S2∩Ci|时,该社区的影响取决于|Ci|的值。

【技术特征摘要】
1.一种基于多层潜力和社区结构的影响最大化方法,其特征在于:包括两个阶段,第一阶段:社区间基于多层潜力的种子扩算;第二阶...

【专利技术属性】
技术研发人员:尚家兴武红春周尚波林晓然齐颖许冶金
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1