当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于超图采样的影响力最大化方法技术

技术编号:35944257 阅读:24 留言:0更新日期:2022-12-14 10:34
本发明专利技术公开了一种基于超图采样的影响力最大化方法,步骤包括输入社交网络;确定超图采样次数θ;在社交网络图上随机择一节点进行采样,并限定采样深度和采样次数;选取超图采样中度最大的节点作为种子,并使其余节点的度按照会被种子影响的概率更新;以相同方式继续选取度最大的节点作为种子直至选够K个种子;判断选取的种子质量合格,否则采样次数加倍,重新采样并选取种子;该方法构建的独立级联模型通过模拟影响力的传播方式反向采样实现影响力最大种子的筛选;在实施过程中通过约束了超图反向采样的深度,有效加速了采样速度,且采样结果只存储超图的度,不用存储超图本身,使算法的空间复杂度大幅减小,在运行效率上能够得到进一步的优化。够得到进一步的优化。够得到进一步的优化。

【技术实现步骤摘要】
一种基于超图采样的影响力最大化方法


[0001]本专利技术涉及影响力最大化
,特别涉及一种基于超图采样的影响力最大化方法。

技术介绍

[0002]个人的思想、情感、态度和行为,会在与其他人或群体互动的过程中,发生改变,这一改变的过程被称为影响。影响在社会生活中有许多不同形式,比如说服、从众等,其来源于权威人士或亲朋好友的影响,会在社会中传播得更为迅速,呈现出裂变式的效果。而一些商家就利用这一特性,倾向于在社交网络中选择一群KOL,即关键意见领袖,主动推广产品,以希望让更多人接受和购买该产品,而这些购买该产品的新用户又会在他们的朋友圈中进行推广。基于此,商家就会希望,可以找出最佳的一群KOL,来使得最终接受该产品的人最多。如何寻找这样一群最佳的KOL作为种子,进行营销推广,被称为影响力最大化问题。更为一般的,影响力最大化问题被定义为,在社交网络图G=(V,E)中(V是顶点集,代表用户,E是边集,代表用户之间的关系),选取K个用户作为种子,按照给定的传播方式M,使得这K个用户在图中激活的节点数最大即产生的影响最大。
[0003]目前基于反向影响采样力采样的方法是求解影响力最大化问题的最佳方法。反向采样方法认为,基于给定图G中随机选择的节点v和在某个传播模型下从图G中随机选择的实例g,若令R(v)表示g中可以到达v的节点集,则如果一组节点与R(v)重叠的概率较高,则其影响更大;每个R(v)称为一个随机反向可达集,即一个样本,则生成样本的过程可以分为两个阶段:1)随机选择一个节点v,2)图G在传播模型下的实例g中,获取R(v);当生成足够多的随机反向可达集合后,利用贪心算法从这些反向可达集找出覆盖最多的K个节点作为种子,但此方法的空间复杂度过高,在求解过程中需要耗费大量内存存储反向可达集。

技术实现思路

[0004]本专利技术的目的是提供一种通过限制生成反向可达集合时采样的深度,以加快采样速度的基于超图采样的影响力最大化方法。
[0005]为此,本专利技术技术方案如下:
[0006]一种基于超图采样的影响力最大化方法,步骤如下:
[0007]S1、构建社交网络G=(V,E),并设定需要选取的种子数为K;其中,V为表示用户的用户节点集,|V|=n;E为表示用户之间的关系边集合,|E|=m;对于任一边e
i
,有e
i
=(u,v)∈E,u是v的入邻居,v是u的出邻居,边e
i
上有一个权重P
uv
∈[0,1],P
uv
表示出邻居v被入邻居u影响的概率;
[0008]S2、计算在社交网络上进行超图采样的采样次数θ,其计算公式为:
[0009][0010]S3、在社交网络图G中,随机选择一个节点v
i
并通过采用独立级联模型进行反向采样,并在采样过程中实时更新各节点的度;其中,
[0011]S301、反向采样前,全部节点处于未被激活态,各节点的度定义为0;
[0012]S302、在t0时刻下,随机激活一个节点u,该节点u转换为激活态节点,同时该节点u的度自增1;
[0013]S303、在t1=t0+1时刻下,获取一个随机值α∈[0,1];基于步骤S302的激活态节点u,遍历激活态节点u的入邻居v,以将激活态节点u与各入邻居v之间边权重P
uv
与随机值α进行比较:1)当随机值α<边权重P
uv
,则影响成功,入邻居v转换为激活态节点,同时入邻居v的度自增1;2)当随机值α≥边权重P
uv
,则影响不成功,入邻居v依然为未激活态节点,同时入邻居v的度不变;此时采样深度为1;
[0014]S304、在t2=t0+2时刻下,重复步骤S303,以获得新的激称活态节点u,同时更新全部节点的度;此时采样深度为2;
[0015]S305、重复步骤S304,直至采样深度达到设定值X;
[0016]S306、重复步骤S302~步骤S305,直至采样次数≥θ;
[0017]S4、选取超图采样中度最大的节点作为种子节点u


[0018]S5、基于步骤S4选取的作为种子节点u

,其余节点w
i
的度按照会被种子影响的概率衰减进行更新;其中,
[0019]S501、基于种子节点u

,计算其余节点被种子影响的概率P

u

w


若对于任一节点w
i
∈V,按照影响的传播方向遍历所有自种子节点u

为起点、节点w
i
为终点的影响传播链,当影响传播链由两个节点构成,则该影响传播链的影响概率为两个节点之间边e∈E上的权重;当影响传播链由两个以上的节点构成,则该影响传播链的影响概率为每相邻两个节点之间边e∈E上的权重的乘积;进而对影响传播链对应的影响概率求和即得到P

u

wi


若对于任一节点w
i
∈V,若按照影响的传播方向遍历所有自种子节点u

为起点、节点w
i
为终点遍历不到任何影响传播链,则P

u

wi
=0;
[0020]S502、其余节点w∈V的度需要衰减为:d(w)

P

u

w
*d(u

),式中,d(w)为节点w的度,P

u

w
为种子节点u

影响节点的w概率,d(u

)为种子节点u

的度;
[0021]S6、基于步骤S5更新得到的全部节点的度,再次选取非种子节点中度最大的节点作为种子,并重复步骤S5;
[0022]S7、重复步骤S6,直至选出的种子总数达到步骤S1设定的K个;
[0023]S8、判断经过步骤S4~步骤S6选取的K个种子的质量是否满足阈值ept:1)若K个种子的质量≥阈值ept,采样过程结束;2)若K个种子的质量≥阈值ept,则回到步骤S2,将采样次数变更原采样次数的二倍,并重复上述步骤S3~步骤S7,重新进行采样和种子选取步骤,直至再次选取出K个种子;其中,K个种子的质量设定为对K个种子的度求和得到的数值。
[0024]进一步地,在步骤S2中,∈的取值为0.01。
[0025]进一步地,在步骤S3中,X≤3。
[0026]与现有技术相比,该基于超图采样的影响力最大化方法构建了全新的独立级联模型,通过模拟影响力的传播方式基于反向采样法实现影响力最大种子的筛选;在具体实施过程中通过约束了超图反向采样的深度,有效加速了采样速度;同时针对采样结果只存储超图的度,而不用存储超图本身,使算法的空本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超图采样的影响力最大化方法,其特征在于,步骤如下:S1、构建社交网络G=(V,E),并设定需要选取的种子数为K;其中,V为表示用户的用户节点集,|V|=n;E为表示用户之间的关系边集合,|E|=m;对于任一边e
i
,有e
i
=(u,v)∈E,u是v的入邻居,v是u的出邻居,边e
i
上有一个权重P
uv
∈[0,1],P
uv
表示出邻居v被入邻居u影响的概率;S2、计算在社交网络上进行超图采样的采样次数θ,其计算公式为:S3、在社交网络图G中,随机选择一个节点v
i
并通过采用独立级联模型进行反向采样,并在采样过程中实时更新各节点的度;其中,S301、反向采样前,全部节点处于未被激活态,各节点的度定义为0;S302、在t0时刻下,随机激活一个节点u,该节点u转换为激活态节点,同时该节点u的度自增1;S303、在t1=t0+1时刻下,获取一个随机值α∈[0,1];基于步骤S302的激活态节点u,遍历激活态节点u的入邻居v,以将激活态节点u与各入邻居v之间边权重P
uv
与随机值α进行比较:1)当随机值α<边权重P
uv
,则影响成功,入邻居v转换为激活态节点,同时入邻居v的度自增1;2)当随机值α≥边权重P
uv
,则影响不成功,入邻居v依然为未激活态节点,同时入邻居v的度不变;此时采样深度为1;S304、在t2=t0+2时刻下,重复步骤S303,以获得新的激称活态节点u,同时更新全部节点的度;此时采样深度为2;S305、重复步骤S304,直至采样深度达到设定值X;S306、重复步骤S302~步骤S305,直至采样次数≥θ;S4、选取超图采样中度最大的节点作为种子节点u

;S5、基于步骤S4选取的作为种子节点u

,其余节点w
i
的度按照会被种子影响的概率衰减进行更新;其中,S501、基于种子节点u

,计算其余节点被种子影响的概率P

u

w

①<...

【专利技术属性】
技术研发人员:于策马骥鹏甘新标肖健孙超毕重科汤善江魏继增
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1