当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于节点特性的影响力最大化初始节点选取方法技术

技术编号:11459474 阅读:105 留言:0更新日期:2015-05-14 16:39
本发明专利技术提出了一种基于节点特性的在线社会网络影响力最大化初始节点选取方法。首先在网络中,基于用户活跃度、用户敏感度和用户亲密度三方面因素,对节点特性进行评价,并以此为依据对节点之间的信用值进行重新定义和分配,节点之间的信用值大小体现节点之间的影响力,如果两个相邻节点相继执行相同的行为,则认为后者被前者影响,为前者分配信用,之后我们结合网络结构和用户行为日志,计算网络中任意两节点之间的信用值大小,并通过贪心算法,递归选取边际收益最大的节点组成影响力最大化初始节点集合。本发明专利技术改进了以往仅依据节点度值评价节点影响力规则的弊端,减少了运算时间和内存消耗,能更真实有效地描述并预测影响力的传播过程。

【技术实现步骤摘要】
一种基于节点特性的影响力最大化初始节点选取方法
本专利技术属于计算机
,涉及一种基于节点特性的影响力最大化初始节点选取方法。
技术介绍
互联网的发展不仅为我们带来了便捷生活方式,还使我们交流与沟通的方式发生了巨大的变化。我们交友与分享智慧的途径也随着在线社会网络的发展变得更加丰富多样。随着越来越多的人使用诸如移动终端等更加便捷的数据交换服务,我们的社会结构和社会关系网络变得更加复杂和紧密。一般情况下,我们使用图结构对社会群体中的人与人之间的关系进行建模,节点代表个体,而边或者弧代表个体之间的关系。通过在线社会网络中用户之间的关系,信息可以以极快的速度和极小的代价进行传播,正因为如此,影响力在社会网络中的传播和分布为病毒式营销带来了前所未有的机遇和挑战,如何找到初始用户群体使得信息最终的影响传播范围最大已成为热点研究领域之一。对于影响力最大化问题,当前大部分的研究工作都是基于对传统经典影响力级联模型的优化,或者对启发式算法的准确度进行改进,对于影响力的评估则主要基于网络结构和节点度值,用户自身的特性和用户与用户之间的行为相似性很少被挖掘并被应用于对节点影响力的评估中。针对上述不足,我们提出一种对于节点初始影响力的评估方案,这种方法结合了用户特性,用户与行为之间关联关系以及用户之间行为相似度对节点之间的影响力进行评价。同时,我们依据提出的节点之间的影响力评价标准对信用进行分配,并结合贪心算法得到初始影响力最大化节点集合。
技术实现思路
本专利技术提出了一种更加真实有效的基于节点特性的影响力最大化初始节点选取方法,在评价节点之间影响力的过程中结合用户活跃度,用户敏感度以及用户亲密度对节点之间的影响力进行评价,根据时间特性计算节点之间的用户影响力大小,并且结合网络结构和用户行为日志对信用分布和影响力的传播过程进行构建,最后结合贪心算法选取边际收益最大的节点得到初始影响力最大化节点集合。具体步骤如下:步骤1:对在线社会网络数据集进行处理,得到真实的用户行为日志和网络结构文件;步骤2:遍历用户行为日志,对网络中的每一个节点,分别计算用户活跃度,用户敏感度和用户亲密度,对u节点,用户活跃度act(u)定义为:代表节点u执行的行为的个数,代表节点u受到邻居节点影响而被动执行的行为个数,代表训练集中记录的行为总个数,参数λ对两种行为数量指标进行控制,取值范围为(0,1),用户敏感度定义如下:记录节点u的所有邻居节点中首次执行行为a的时刻,tu(a)代表节点u最终被影响而执行相同行为a的时刻,τu代表节点u与其邻居节点之间的平均延迟时间;当两个时刻的时间跨度越长,的值就越小,用户亲密度pv,u计算公式如下:表示节点u和节点v执行行为种类集合的并集,表示节点u和节点v执行行为种类集合的交集;步骤3:分别对用户敏感度和用户亲密度进行归一化处理,节点u的用户平均敏感度和用户平均亲密度计算规则如下:代表训练集中记录的行为,N(u)表示节点u的邻接节点集合,v∈N(u),初始用户影响力定义为:给定节点u与其邻居节点v之间的平均延迟时间τv,u和节点u的初始用户影响力iniful(u),使用连续衰减函数对邻接节点v和节点u之间的影响力进行变换,计算公式如下:代表节点v对节点u对于行为a的用户影响力,是节点v执行行为a的时刻,Nout(u)表示节点v的出邻居节点集合,u∈Nout(v),tu(a)代表节点u最终被影响而执行相同行为a的时刻;步骤4:定义分配给节点v让其影响节点u的信用,对于任意的两个节点v和节点u,给予节点v让其影响节点u的总信用定义为:其中,Nin(u)表示节点u的入邻居节点集合,节点w为节点u的入邻居,w∈Nin(u),γw,u(a)代表给予节点w让其影响邻接节点u的直接信用,公式表示对于任意的两个节点v和节点u,给予节点v让其影响节点u的总信用等于以节点u的所有入邻居为中间节点,给予节点v让其影响节点u的信用乘积之和,令γw,u(a)等于节点w对节点u对于行为a的用户影响力,即相似地,给予一个节点集合S让其影响节点u的总信用计算公式如下:步骤5:通过遍历用户行为传播日志,沿着行为传播路径逆向进行信用分配,计算节点x对于所有行为的边际收益:σcd(x)为对于节点x的影响力传播函数,S为当前初始节点集合,V代表网络中全体节点的总集,为通过行为a在节点集合V-S中给予节点x让其影响节点u的信用,为给予节点v让其影响除当前初始节点集合S之外的其他节点的总信用,ΓS,x(a)代表对于行为a,给予当前初始节点集合的S的信用值,节点的信用值越高代表影响力越大,结合贪心算法递归选取边际收益最大的节点插入初始节点集合S;步骤6:判断初始节点集合中元素的个数是否已经达到要求的个数k,如果已经达到,则得到最终的初始节点集合,如果未达到,则对除当前初始节点集合之外的节点之间的信用分布进行更新,并重新回到步骤5。本专利技术是一种基于节点特性的影响力最大化初始节点的选取评估方案,这种方法结合了用户特性,用户与行为之间关联关系以及用户之间行为相似度更加真实地评价节点之间的影响力。同时,依据时间特性对影响力和信用值的评价标准进行改进,符合节点之间影响力随时间衰减的特性,并且结合网络结构和用户行为日志对信用分布和影响力的传播过程进行构建,通过学习用户真实的行为记录,本专利技术方法能够更加准确有效地选取初始节点,并获得更好的影响力传播效果。附图说明图1是本专利技术提出的一种基于节点特性的影响力最大化初始节点选取方法流程图;图2是本专利技术提出的一种基于节点特性的影响力最大化初始节点选取方法的关键步骤;图3是实施例1中不同的方法对于初始节点选取所消耗的运行时间对比图,左图为4种方法在0到160分钟时间跨度内运行时间实验结果对比,右图为2种方法在1到3分钟的时间跨度内运行时间实验结果对比;图4是实施例1中不同的方法对于初始节点选取所消耗的内存空间对比图,左图为4种方法在0到100MB空间跨度中消耗内存的实验结果对比,右图为2种方法在0到50MB的空间跨度中消耗内存的实验结果对比;图5是实施例2中不同的方法对于初始节点集合的影响力传播效果对比图,左图为4种方法对于选取的初始节点集合影响力传播的实验结果曲线表示形式,右图为2种方法对于选取的初始节点集合影响力传播实验结果的柱状图表示形式。图6是实施例2中对于测试集用户行为的影响力预测结果对比图,左图为2种方法对测试集行为影响力预测结果的散点图表示形式,右图为2种方法对行为影响力预测结果的柱状图表示形式。具体实施方式下面将结合附图、理论分析和仿真实验对本专利技术作进一步的详细说明。本专利技术将社会网络构造为一个无向图G=(V,E),其中V表示图中全体节点的集合,E代表不同个体之间关系的集合,S代表初始节点集合,σ(S)表示影响力传播函数,在本专利技术中将影响力体现为赋予节点的信用值的大小,节点被分配的信用值越高代表节点的影响力越大,所以σcd(S)定义为给予当前节点集合S让其影响其余节点的总信用,即影响力最大化问题就是找到个数为k的初始节点集合,使得最终在整个网络中被成功影响的节点个数的期望值最大。节点的权值体现节点的特异性。一方面,不同的个体往往有不同的兴趣爱好和不同的偏好取向,当不同的人面对相同的事物的时候,是否接受该事物取本文档来自技高网...
一种基于节点特性的影响力最大化初始节点选取方法

【技术保护点】
一种基于节点特性的影响力最大化初始节点选取方法包括以下步骤:步骤1:对在线社会网络数据集进行处理,得到真实的用户行为日志和网络结构文件;步骤2:遍历用户行为日志,对网络中的每一个节点,分别计算用户活跃度,用户敏感度和用户亲密度,对u节点,用户活跃度act(u)定义为:代表节点u执行的行为的个数,代表节点u受到邻居节点影响而被动执行的行为个数,代表训练集中记录的行为总个数,参数λ对两种行为数量指标进行控制,取值范围为(0,1),用户敏感度定义如下:记录节点u的所有邻居节点中首次执行行为a的时刻,tu(a)代表节点u最终被影响而执行相同行为a的时刻,τu代表节点u与其邻居节点之间的平均延迟时间;当两个时刻的时间跨度越长,的值就越小,用户亲密度pv,u计算公式如下:表示节点u和节点v执行行为种类集合的并集,表示节点u和节点v执行行为种类集合的交集;步骤3:分别对用户敏感度和用户亲密度进行归一化处理,节点u的用户平均敏感度和用户平均亲密度计算规则如下:pu^=1|N(u)|Σv∈N(u)pv,u]]>代表训练集中记录的行为,N(u)表示节点u的邻接节点集合,v∈N(u),初始用户影响力定义为:给定节点u与其邻居节点v之间的平均延迟时间τv,u和节点u的初始用户影响力iniful(u),使用连续衰减函数对邻接节点v和节点u之间的影响力进行变换,计算公式如下:Ψu∈Nout(v)v,u(a)=iniful(v)·exp(-(tu(a)-tv0(a))24π·τv,u)]]>代表节点v对节点u对于行为a的用户影响力,是节点v执行行为a的时刻,Nout(v)表示节点v的出邻居节点集合,u∈Nout(v),tu(a)代表节点u最终被影响而执行相同行为a的时刻;步骤4:定义分配给节点v让其影响节点u的信用,对于任意的两个节点v和节点u,给予节点v让其影响节点u的总信用定义为:Γv,u(a)=Σw∈Nin(u)Γv,w(a)·γw,u(a)]]>其中,Nin(u)表示节点u的入邻居节点集合,节点w为节点u的入邻居,w∈Nin(u),γw,u(a)代表给予节点w让其影响邻接节点u的直接信用,公式表示对于任意的两个节点v和节点u,给予节点v让其影响节点u的总信用等于以节点u的所有入邻居为中间节点,给予节点v让其影响节点u的信用乘积之和,令γw,u(a)等于节点w对节点u对于行为a的用户影响力,即相似地,给予一个节点集合S让其影响节点u的总信用计算公式如下:ΓS,u(a)=Σw∈Nin(u)∩w∉SΓS,w(a)·γw,u(a)]]>步骤5:通过遍历用户行为传播日志,沿着行为传播路径逆向进行信用分配,计算节点x对于所有行为的边际收益:σcd(x)为对于节点x的影响力传播函数,S为当前初始节点集合,V代表网络中全体节点的总集,为通过行为a在节点集合V‑S中给予节点x让其影响节点u的信用,为给予节点v让其影响除当前初始节点集合S之外的其他节点的总信用,ΓS,x(a)代表对于行为a,给予当前初始节点集合的S的信用值,节点的信用值越高代表影响力越大,结合贪心算法递归选取边际收益最大的节点插入初始节点集合S;步骤6:判断初始节点集合中元素的个数是否已经达到要求的个数k,如果已经达到,则得到最终的初始节点集合,如果未达到,则对除当前初始节点集合之外的节点之间的信用分布进行更新,并重新回到步骤5。...

【技术特征摘要】
1.一种基于节点特性的影响力最大化初始节点选取方法包括以下步骤:步骤1:对在线社会网络数据集进行处理,得到真实的用户行为日志和网络结构文件;步骤2:遍历用户行为日志,对网络中的每一个节点,分别计算用户活跃度,用户敏感度和用户亲密度,对u节点,用户活跃度act(u)定义为:代表节点u执行的行为的个数,代表节点u受到邻居节点影响而被动执行的行为个数,代表训练集中记录的行为总个数,参数λ对两种行为数量指标进行控制,取值范围为(0,1),用户敏感度定义如下:记录节点u的所有邻居节点中首次执行行为a的时刻,tu(a)代表节点u最终被影响而执行相同行为a的时刻,τu代表节点u与其邻居节点之间的平均延迟时间;当两个时刻的时间跨度越长,的值就越小,用户亲密度pv,u计算公式如下:表示节点u和节点v执行行为种类集合的并集,表示节点u和节点v执行行为种类集合的交集;步骤3:分别对用户敏感度和用户亲密度进行归一化处理,节点u的用户平均敏感度和用户平均亲密度计算规则如下:代表训练集中记录的行为,N(u)表示节点u的邻接节点集合,v∈N(u),初始用户影响力定义为:给定节点u与其邻居节点v之间的平均延迟时间τv,u和节点u的初始用户影响力iniful(u),使用连续衰减函数对邻接节点v和节点u之间的影响力进行变换,计算公式如下:代表对于行为a而言,节点v对节点u的用户影响力,是节点v执行行为a的时刻,Nout(v)表示节点v的出邻居节点集合,u∈Nout(v),tu(a)代表节点u最终被影响而执行相同行为a的时刻;步骤...

【专利技术属性】
技术研发人员:邓晓衡潘琰朱从旭林立新沈海澜李登
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1