当前位置: 首页 > 专利查询>云南大学专利>正文

一种度量社会网络影响力的方法技术

技术编号:24412812 阅读:19 留言:0更新日期:2020-06-06 10:00
本发明专利技术公开了一种度量社会网络影响力的方法,本发明专利技术以有效地选择种子节点。算法1显示了CCIM算法的伪代码。首先,通过社区检测算法将网络G(V,E)划分为M个社区,然后计算节点的影响并找到影响力最大的种子节点。为了避免重复计算,我们采用边际增益策略的增量计算。选择种子节点后,删除重叠影响并重新计算其余节点的影响。最后,种子节点以特定的扩散模型在网络中传播影响力以最大化影响范围。

A method to measure the influence of social network

【技术实现步骤摘要】
一种度量社会网络影响力的方法
本专利技术涉及互联网
,尤其涉及一种度量社会网络影响力的方法。
技术介绍
近年来,互联网技术的飞速发展促进了Twitter,微博和微信等社交网络的发展。社交网络是具有个体之间错综复杂关系的网络,它促进了信息在个体之间的传播。影响力最大化(InfluenceMaximization,IM)的目的是确定一定数量的最具影响力的用户,通过信息扩散使最终受影响的用户的预期数量最大化。由于其广泛的实际应用,如病毒营销[1,2],谣言控制[3,4]和级联检测[5],影响最大化引起了研究人员和专家的极大关注。IM问题首先由Kempe等人[6]提出,证明了其是NP难问题,并提出了具有保证求解精度的贪心算法。传统的贪心算法具有较高的时间复杂度,因此无法应用于规模较大的网络。为了解决这个问题,近年来研究者提出了许多近似算法和启发式方法,例如基于仿真的算法[5,7],基于中心度的算法[8,9,10],基于路径的算法[11,12,13]和基于社区的算法[14,15,16,17,18]。基于社区的算法通常利用社区中节点的影响来近似其对整个网络的影响。社区结构[19]是网络最突出的特征之一,其被描述为一个特殊的群体,其中节点在社区内连接紧密,而在社区间连接稀疏。它揭示了网络的组织结构和功能组件,并从中观层面描述了网络的结构。对于社区中的两个节点,即使由于数据的稀疏性,它们在微观结构中仅具有弱关系,但由于社区结构的限制,它们之间的影响将得到加强。另外,由于一个人的影响范围是有限的,因此可以用一个社区的影响来近似其对整个网络的影响。利用社区的规模比整个网络小得多的优势,可以在保证解决方案精度的情况下更有效地计算节点的影响力;现有的基于社区的IM算法已经取得了一些成果,例如CoFIM[17]和IMPC[18]。但是,这些算法仅考虑了社区中节点的数量,而忽略了社区中边的连接密度。如图1(a)所描述的具有社区结构的网络,社区C3与C4中有相同数量的节点,但是中的边数比.C3.中的要多。仅考虑节点数量,两个社区的影响是相同的。但是,社区中边的数量越多,表明节点之间进行交互的可能性就越高,这可能会增加激活非激活节点的机会。因此,区分C3和.C4.的影响有利于更准确地度量节点的影响力。另外,现有方法只能应用于非重叠的社区结构。但在现实世界中,社区通常是重叠的,即一个节点可能属于许多社区。例如,在图1(b)中,节点v1属于C1,和C4三个社区,因此其对三个社区中的节点都具有影响。IM的研究一直是社会网络分析中的热门研究课题,旨在寻找社交网络中最具影响力的用户,以最大程度地扩大影响力。近年来,许多研究都集中在IM的问题上,利用小规模社区结构来提高运行效率。但是,现有的基于社区的影响力最大化方法仅考虑社区中节点的数量,而忽略社区中节点之间连接的密度。此外,现有研究方法只能应用于非重叠的社区结构。
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供一种度量社会网络影响力的方法。本专利技术通过以下技术方案来实现上述目的:本专利技术包括以下步骤:问题定义:给定一个网络G,目标是选择一组最具影响力的节点S,在特定的扩散模型下最大化预期的总激活节点数σ(S):S*=argSmaxσ(S)(1)影响力度量:设一个激活节点u的影响扩散过程分为两个阶段,一个阶段称为多邻居传播,另一个阶段称为社区传播;(1)多邻居影响:在多邻居传播过程中,影响传播的两个步骤:首先,影响从节点u传播到N(u),这是u对N(u)的直接影响;然后影响将继续从N(u)中的激活节点传播到N(N(u)),这是节点u通过N(u)对N(N(u))的间接影响;对于每个激活节点u,通过这种信息级联扩散的方式,其对两跳以上的邻居影响较小,很难间接激活它们;因此仅考虑其对一跳邻居N(u)和两跳邻居N(N(u))的影响;设puv表示u对v的影响概率,IN1(u)和IN2(u)分别表示节点u对一跳邻居和两跳邻居的影响,则IN1(u)和IN2(u)被定义为等式(2)[20]和(3);然后,将节点u的多邻居影响表示为f1(u),用以下公式近似表示:f1(u)=IN1(u)+IN2(u)(4)由于N(u)和N(N(u))是u直接和间接邻居,因此u对N(u)的影响是直接的,而u对N(N(u))的影响是间接的;直接影响大于间接影响,因此N(u)中的节点更有可能被u激活;如果仅考虑激活节点u的影响,则在多邻居传播之后,N(u)包含的激活节点比例要大于N(N(u))中激活节点的比例;(2)社区影响:由于激活节点对BC(u)和NC(u)以外的其他社区影响较小,为简化起见,忽略了对除BC(u)和NC(u)以外的其他社区的影响;激活节点在BC(u)中的影响称为社区内影响,而激活节点在NC(u)中的影响称为社区间影响;基于社区中节点之间的平均最短距离定义社区紧密度的概念;给出了社区内影响和社区间影响的定义;定义1.社区紧密度.假设Ci是一个社区,d(u,v)min是节点u和v之间的最短路径,u,v∈Ci,则该社区Ci的紧密度定义为:close(Ci)是社区Ci中节点的平均最短路径,它反映了Ci中边的连接密度,close(Ci)值越小表明Ci的影响越大;(2.1)社区内影响社区内影响度量了BC(u)中激活的节点对BC(u)中的非激活节点的影响;设Ai表示社区Ci∈BC(u)中激活的节点,则影响将从Ai扩散到Ci中的非激活节点;在级联扩散过程中,影响力会随着路径长度的增加而减小;显然,Ai中的激活节点和Ci中的非激活节点之间的路径越短则表明非激活节点越容易被激活;Ci中的非激活节点到Ai的平均路径表示为cd(u,Ci,Ai),其定义为:其中d(v,Ai)min表示为节点v到Ai的最短路径,|Ci/(u∪Ai)|表示社区Ci中非激活节点的数量,cd(u,Ci,Ai)是考虑了Ai的社区紧密度的一种变体;cd(u,Ci,Ai)的值越小,表明社区Ci中的节点与Ai的联系越紧密,因此Ai对社区Ci的影响就越大;当影响在社区中传播时,社区中的影响力不仅取决于社区的紧密程度,还取决于社区中节点的数量;社区中节点越多意味着可能会有更多的节点被激活;因此,我们将社区中的节点数标准化为社区的权重,表示为因此,越大并且cd(u,Ci,Ai)越小,表明社区Ci的影响力更大;因此,我们通过结合权重和社区的紧密度来度量节点的社区内影响,记为IC1(u),其定义为:(2.2)社区间影响社区间影响度量了NC(u)中的激活节点对NC(u)中的非激活节点的影响;由于节点u∈Ci与邻居社区Cj∈NC(u)之间的连接稀疏,因此对于每个Cj,Cj中的激活节点数量(Aj)很小,因此Aj对社区Cj的影响相对较小;忽略了影响从Aj到NC(u)的传播过程,并用社区自身的影响力来估计节点u的社区间影响;与社区内影响本文档来自技高网
...

【技术保护点】
1.一种度量社会网络影响力的方法,其特征在于,包括以下步骤:/n问题定义:/n给定一个网络G,目标是选择一组最具影响力的节点C

【技术特征摘要】
1.一种度量社会网络影响力的方法,其特征在于,包括以下步骤:
问题定义:
给定一个网络G,目标是选择一组最具影响力的节点C2C4S,在特定的扩散模型下最大化预期的总激活节点数σ(S):
S*=argSmaxσ(S)(1)
影响力度量:
设一个激活节点u的影响扩散过程分为两个阶段,一个阶段称为多邻居传播,另一个阶段称为社区传播;
(1)多邻居影响:
在多邻居传播过程中,影响传播的两个步骤:首先,影响从节点u传播到N(u),这是u对N(u)的直接影响;然后影响将继续从N(u)中的激活节点传播到N(N(u)),这是节点u通过N(u)对N(N(u))的间接影响;对于每个激活节点u,通过这种信息级联扩散的方式,其对两跳以上的邻居影响较小,很难间接激活它们;因此仅考虑其对一跳邻居N(u)和两跳邻居N(N(u))的影响;
设puv表示u对v的影响概率,IN1(u)和IN2(u)分别表示节点u对一跳邻居和两跳邻居的影响,则IN1(u)和IN2(u)被定义为等式(2)[20]和(3);






然后,将节点u的多邻居影响表示为f1(u),用以下公式近似表示:
f1(u)=IN1(u)+IN2(u)(4)
由于N(u)和N(N(u))是u直接和间接邻居,因此u对N(u)的影响是直接的,而u对N(N(u))的影响是间接的;直接影响大于间接影响,因此N(u)中的节点更有可能被u激活;如果仅考虑激活节点u的影响,则在多邻居传播之后,N(u)包含的激活节点比例要大于N(N(u))中激活节点的比例;
(2)社区影响:
由于激活节点对BC(u)和NC(u)以外的其他社区影响较小,为简化起见,忽略了对除BC(u)和NC(u)以外的其他社区的影响;激活节点在BC(u)中的影响称为社区内影响,而激活节点在NC(u)中的影响称为社区间影响;
基于社区中节点之间的平均最短距离定义社区紧密度的概念;给出了社区内影响和社区间影响的定义;
定义1.社区紧密度.假设Ci是一个社区,d(u,v)min是节点u和v之间的最短路径,u,v∈Ci,则该社区Ci的紧密度定义为:
close(Ci)是社区Ci中节点的平均最短路径,它反映了Ci中边的连接密度,close(Ci)值越小表明Ci的影响越大;
(2.1)社区内影响
社区内...

【专利技术属性】
技术研发人员:吴晴晴周丽华黄亚群
申请(专利权)人:云南大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1