一种基于加权反向采样的谣言遏制方法技术

技术编号:28133314 阅读:26 留言:0更新日期:2021-04-19 11:58
本发明专利技术公开了一种基于加权反向采样的谣言遏制方法。本发明专利技术通过对谣言

【技术实现步骤摘要】
一种基于加权反向采样的谣言遏制方法


[0001]本专利技术属于多媒体数据挖掘
,尤其涉及一种基于加权反向采样框架在社交网络中搜索结果集合以达到谣言遏制最大化效果的方法。

技术介绍

[0002]随着在线社交平台的快速发展,观点和创新技术可以通过社交网络迅速传播,但是这也为负面信息或谣言的传播提供了媒介。谣言作为社交网络中一种普遍存在的现象,不仅浪费信息传播资源,也极易造成社会混乱和恐慌。因此,有效的谣言遏制策略具有重大的社会价值。在信息传播过程中,当用户收到两种相反的意见时,他们倾向于接受第一种意见。基于此,一旦检测到错误信息或谣言,一种有效的谣言遏制方法就是引入与谣言竞争的真相节点。在给定预算k的情况下,谣言遏制问题要求找到k个节点传播真相,最终使得被保护的节点数量最大化。

技术实现思路

[0003]本专利技术的目的在于针对现有技术的不足,提供一种基于加权反向采样的谣言遏制方法。
[0004]本专利技术的目的是通过以下技术方案实现的:
[0005]根据本专利技术的第一方面,提供一种基于加权反向采样的谣言遏制方法,包括如下步骤:
[0006]步骤1:给定原始有向图G(V,E),其中V代表图中的节点集合,E代表图中的边集合;该图中共有n个节点,m条边;对于每个点v∈V,用d
in
(v)代表在G中点v的入度;对原始有向图G做以下预处理操作得到图G


[0007]1.1利用PageRank算法得到每个点的权重,即G中任意一个点v都有一个权重w
v
∈[0,1),代表这个节点的重要程度;
[0008]1.2对于任意一条边<v
i
,v
j
>,设定这条边上的概率p
ij
=1/d
in
(v
j
),且p
ij
∈[0,1),代表节点v
i
影响节点v
j
的概率;
[0009]1.3随机从G中选取k个点,将这些点设定为谣言节点,其他节点设定为无辜节点。
[0010]步骤2:设计加权反向采样框架,该框架定义了加权竞争反向可达集合,记为WRR集合;设针对v点的WRR集合为T
v
,则T
v
由一组可以保护初始节点v不被谣言节点影响的点组成;生成一个WRR的步骤如下:
[0011]2.1在图G

上,以节点权重占比为抽取概率选取节点v作为初始节点;
[0012]2.2对图G

进行反向操作得到图G

,边上的概率保持不变;
[0013]2.3以初始节点v为出发点,在图G

上进行遍历;遍历过程中,每条边<v
i
,v
j
>以概率p
ji
被遍历,将遍历过程中经过的点存储在WRR中;一旦没有新的无辜节点被遍历,就停止遍历过程并返回集合WRR,或者在谣言节点被遍历到时,返回遍历到谣言节点之前存储的结果集合WRR。
[0014]步骤3:利用步骤2的加权反向采样框架,生成含有n1个WRR的集合T1;在集合T1上,通过贪心算法获得临时结果集S

;判断临时结果集S

覆盖的T1中的WRR集合数量是否足够多,若数量满足要求则执行步骤4,否则,对T1的采样数量进行加倍,即下一次n1为此时n1的两倍,并重复步骤3。
[0015]步骤4:通过加权反向采样框架生成另一最多含有n2个WRR的集合T2,并基于集合T2验证临时结果集S

的正确性,具体包括:
[0016]4.1初始化i=0和c=0,每生成一个WRR集合T
v
,i的值加一,并且判断x(S

,T
v
)是否为1,若x(S

,T
v
)=1,则c的值加一;其中,当集合S

与T
v
中存在相同的点时,x(S

,T
v
)=1,否则,x(S

,T
v
)=0;
[0017]4.2判断临时结果集S

覆盖的T2中的WRR集合数量是否足够多以及i的个数是否超过n2,若数量满足要求且i的个数没有超过n2,则计算临时影响力估计值f'(S

)=c
·
(∑
u∈V
w
u
)/i,否则,影响力估计值设为
[0018]4.3判断得到的临时结果集S

是否有近似保证,若不满足近似保证,则对T1的采样数量进行加倍,即下一次n1为此时n1的两倍,并重复步骤3

4;若满足近似保证,返回集合S

作为最终结果集合。
[0019]进一步地,所述步骤2中,在图G

上以节点权重占比w
v
/∑
u∈V
w
u
为抽取概率选取节点v作为初始节点。
[0020]进一步地,所述步骤3中,贪心算法分k轮,每一轮都要找到一个点,将其存储在S

中,使得当它作为真相节点时,在谣言

真相竞争级联传播模型下,对已找到的真相节点来说边界增量最大,即增加的被保护无辜节点数目最多。
[0021]进一步地,所述步骤3中,在谣言

真相竞争级联传播模型中,共有谣言节点、真相节点、无辜节点三种节点类型,其中谣言节点和真相节点同时传播,一旦无辜节点被谣言节点或者真相节点影响,这个节点就被标记为谣言节点或者真相节点,且保持状态不变;如果一个无辜节点被真相节点影响,称这个节点被保护。
[0022]进一步地,所述步骤3中,判断临时结果集S

覆盖的T1中的WRR集合数量是否足够多,即判断不等式是否成立,其中e是自然常数,∈表示设定的误差系数,δ表示设定的结果概率系数。
[0023]进一步地,所述步骤4中,其中e是自然常数,∈表示设定的误差系数。
[0024]进一步地,所述步骤4中,判断临时结果集S

覆盖的T2中的WRR集合数量是否足够多即判断不等式是否成立,其中e是自然常数,∈表示设定的误差系数,δ表示设定的结果概率系数。
[0025]进一步地,所述步骤4.3中,返回集合S

作为最终结果集合,通过确定这k个用户以启动真相节点传播,可以在图中最大程度地保护无辜节点的数量。
[0026]根据本专利技术的第二方面,提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述基于加权反向采样的谣本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于加权反向采样的谣言遏制方法,其特征在于,该方法包括如下步骤:步骤1:给定原始有向图G(V,E),其中V代表图中的节点集合,E代表图中的边集合;该图中共有n个节点,m条边;对于每个点v∈V,用d
in
(v)代表在G中点v的入度;对原始有向图G做以下预处理操作得到图G

:1.1利用PageRank算法得到每个点的权重,即G中任意一个点v都有一个权重w
v
∈[0,1),代表这个节点的重要程度;1.2对于任意一条边<v
i
,v
j
>,设定这条边上的概率p
ij
=1/d
in
(v
j
),且p
ij
∈[0,1),代表节点v
i
影响节点v
j
的概率;1.3随机从G中选取k个点,将这些点设定为谣言节点,其他节点设定为无辜节点。步骤2:设计加权反向采样框架,该框架定义了加权竞争反向可达集合,记为WRR集合;设针对v点的WRR集合为T
v
,则T
v
由一组可以保护初始节点v不被谣言节点影响的点组成;生成一个WRR的步骤如下:2.1在图G

上,以节点权重占比为抽取概率选取节点v作为初始节点;2.2对图G

进行反向操作得到图G

,边上的概率保持不变;2.3以初始节点v为出发点,在图G

上进行遍历;遍历过程中,每条边<v
i
,v
j
>以概率p
ji
被遍历,将遍历过程中经过的点存储在WRR中;一旦没有新的无辜节点被遍历,就停止遍历过程并返回集合WRR,或者在谣言节点被遍历到时,返回遍历到谣言节点之前存储的结果集合WRR。步骤3:利用步骤2的加权反向采样框架,生成含有n1个WRR的集合T1;在集合T1上,通过贪心算法获得临时结果集S

;判断临时结果集S

覆盖的T1中的WRR集合数量是否足够多,若数量满足要求则执行步骤4,否则,对T1的采样数量进行加倍,即下一次n1为此时n1的两倍,并重复步骤3。步骤4:通过加权反向采样框架生成另一最多含有n2个WRR的集合T2,并基于集合T2验证临时结果集S

的正确性,具体包括:4.1初始化i=0和c=0,每生成一个WRR集合T
v
,i的值加一,并且判断x(S

,T
v
)是否为1,若x(S

,T
v
)=1,则c的值加一;其中,当集合S

与T
v
中存在相同的点时,x(S

,T
v
)=1,否则,x(S

,T
v
)=0;4.2判断临时结果集S

【专利技术属性】
技术研发人员:王潇杨吴艳萍徐逸群卢旭峰陈晨
申请(专利权)人:浙江工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1