一种基于随机生长的社交网络关键转发者检测方法技术

技术编号:34891929 阅读:19 留言:0更新日期:2022-09-10 13:50
本发明专利技术提供了一种基于随机生长的社交网络关键转发者检测方法,首先利用源数据集的各个特征的值计算得到的重要性评分排序,抽取出前A的数据构成初始数据集,得到转发级联;然后通过转发级联,从源数据集中选取数据补充进入初始数据集,形成整体转发级联;再将整体转发级联进行随机生长产生随机生长数据集,随机生长数据集和初始数据集合成为新的中间数据集,形成增广转发级联;最后在随机生长数据集的基础上再次进行随机生长的操作,生成最终数据集;将最终数据集投入图卷积神经网络模型进行训练,得到用于检测社交网络中关键转发者的模型。本发明专利技术减少了训练模型的开销,提高了模型效率,为社交网络关键转发者的检测提供了有力的支持。的支持。的支持。

【技术实现步骤摘要】
一种基于随机生长的社交网络关键转发者检测方法


[0001]本专利技术涉及社交网络中关键转发者的检测方法,特别是一种基于随机生长的社交网络关键转发者检测方法。

技术介绍

[0002]随着社会和科学技术的不断发展,互联网的普及,人与人之间的关系也越来越复杂,各种各样的社交平台层出不穷,这些基于互联网的社交平台已经渗透到人们生活的各个方面,每天人们都会在这些社交平台上阅览和转发数百条消息,在消息转发的过程中,那些影响力更大的转发者对这个过程具有绝对影响力,因此,识别消息传播过程中的关键转发者,并预测关键转发者对公众情绪,平台舆论趋势等产生的影响,在娱乐和商业推广等诸多领域均有着重要的意义。在研究某一具体事件的用户影响力时,现有的文献主要集中在使用底层网络拓扑的知识来识别社交网络中有影响力的用户,这就需要完整的网络拓扑信息,而对于大规模的社交网络来说,获取这些信息通常是困难和昂贵的,并且效率也不高。

技术实现思路

[0003]为了克服现有的社交网络检测关键转发者方法存在的开销大和效率低的不足,本专利技术提供了一种基于随机生长的社交网络关键转发者检测方法,能够高效率且低成本地对社交网络中潜在的关键转发者进行检测,从而合理有效地解决了现有检测方法效率低成本高的问题。
[0004]该方法首先将源数据集的各个特征的值按照AHP公式(层次分析法,可以将复杂问题中的各种因素通过划分重要性、两两比较的方法,对因素的重要性进行定量分析) 计算得到的重要性评分排序,从中按比例抽取出前A的数据构成初始数据集,得到他们的转发级联;然后通过转发级联,从源数据集中选取数据补充进入初始数据集,使原本分散的转发级联重新联系在一起,形成一个整体转发级联;然后根据源数据集,将整体转发级联进行随机生长产生随机生长数据集,随机生长数据集和初始数据集合成为新的中间数据集,形成增广转发级联,新的中间数据集中初始数据集和随机生长数据集的占比为B,打乱随机生长数据集;最后在随机生长数据集的基础上,再次进行随机生长的操作,生成最终数据集,使得初始数据集和随机生长数据集的占比为C;然后将最终数据集投入图卷积神经网络模型进行训练,得到了用于检测社交网络中关键转发者的模型。本专利技术的方法大大减少了训练模型的开销,提高了模型效率,为社交网络关键转发者的检测提供了有力的支持,从而为网络信息建设提供了智能化的辅助。
[0005]本专利技术的技术方案为:
[0006]所述一种基于随机生长的社交网络关键转发者检测方法,包括以下步骤:
[0007]步骤1:设置数据集标签:
[0008]从社交平台上获取源数据集R,所述源数据的特征参数包括推文特征和推文作者特征;
[0009]计算源数据中每条推文的重要性评分GII:
[0010][0011]其中MII
j
为推文作者u
i
发布的推文v
j
的影响力,计算公式如下:
[0012]MII
j
=UII*TII
j
[0013]其中UII表示根据推文作者的特征计算得到的影响力,TII
j
表示根据推文的特征计算得到的影响力;
[0014]步骤2:构建级联;
[0015]构建节点集合V:根据推文Id和推文的一对一映射关系,获得代表推文的节点集合V={v1,v2,v3,

,v
n
},其中n为推文的数量,v
i
表示V中第i个节点即第i篇推文,v
j
为第j篇推文;
[0016]构建边集合E:根据推文彼此之间的转发关系,获得代表推文转发关系的边集合 E={e
ij
|0<i<m,0<j<m},其中m为转发事件的数量,如果推文v
i
的上级推文 Id与推文v
j
的Id相等,则v
j
为v
i
的父推文或者父节点,存在e
ij
∈E,代表v
i
与v
j
之间存在转发关系;
[0017]根据构建的边集合E,获得n*n的邻接矩阵Adj,所述邻接矩阵Adj为源数据集R所构建的转发级联,邻接矩阵Adj中的元素满足公式:
[0018][0019]邻接矩阵Adj的第i行向量[a
i1
,a
i2
,a
i3
,

,a
in
]代表节点集合V中第i篇推文v
i
的被转发信息:如果a
ij
=1,那么节点集合V中第j篇推文v
j
转发了推文v
i
,推文v
j
有一条指向v
i
的有向边;
[0020]将源数据集R中的推文按照步骤1中计算出的重要性评分从大到小排序,取前A 条推文构成初始数据集F,并对这A条推文打上标签1,源数据集R中的其他推文打上标签0;根据初始数据集F中的推文,利用源数据集R所构建的转发级联,通过初始数据集F中的推文Id和上级推文Id构建出若干个转发级联G
i
,且每个转发级联都有对应的根节点r
i

[0021]步骤3:数据集随机生长:
[0022]根据初始数据集F构建的多个转发级联G
i
,从数据集R

F中找出能够连接所述转发级联G
i
的节点所对应的推文N
k
,并将推文N
k
加入到初始数据集F中,使所有转发级联G
i
生长为一个整体转发级联G

,且对应的初始数据集变为完整初始数据集F


[0023]根据整体转发级联G

,从数据集R

F

中随机选择部分推文SN
i
,直接添加进入整体转发级联G

作为新的节点,生成增广转发级联GZ,并对应形成中间数据集M,其中完整初始数据集F

和随机生长的数据集M

F

的推文数量比为B;
[0024]根据增广转发级联GZ,从数据集R

M中随机选择部分推文添加进入增广转发级联GZ作为新的节点,生成最终转发级联GF,并对应形成最终数据集L,其中完整初始数据集F

和随机生长的数据集L

F

的推文数量比为C;
[0025]步骤4:模型训练:
[0026]将所述最终数据集L的前D个推文携带标签,剩余推文不携带标签,并作为训练集投入图卷积神经网络进行半监督训练;
[0027]步骤5:将待检测的数据集投入训练好的图卷积神经网络中,输出数据集中每条推文的标签,根据标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机生长的社交网络关键转发者检测方法,其特征在于:包括以下步骤:步骤1:设置数据集标签:从社交平台上获取源数据集R,所述源数据的特征参数包括推文特征和推文作者特征;计算源数据中每条推文的重要性评分GII:其中MII
j
为推文作者u
i
发布的推文v
j
的影响力,计算公式如下:MII
j
=UII*TII
j
其中UII表示根据推文作者的特征计算得到的影响力,TII
j
表示根据推文的特征计算得到的影响力;步骤2:构建级联;构建节点集合V:根据推文Id和推文的一对一映射关系,获得代表推文的节点集合V={v1,v2,v3,

,v
n
},其中n为推文的数量,v
i
表示V中第i个节点即第i篇推文,v
j
为第j篇推文;构建边集合E:根据推文彼此之间的转发关系,获得代表推文转发关系的边集合E={e
ij
|0<i<m,0<j<m},其中m为转发事件的数量,如果推文v
i
的上级推文Id与推文v
j
的Id相等,则v
j
为v
i
的父推文或者父节点,存在e
ij
∈E,代表v
i
与v
j
之间存在转发关系;根据构建的边集合E,获得n*n的邻接矩阵Adj,所述邻接矩阵Adj为源数据集R所构建的转发级联,邻接矩阵Adj中的元素满足公式:邻接矩阵Adj的第i行向量[a
i1
,a
i2
,a
i3
,

,a
in
]代表节点集合V中第i篇推文v
i
的被转发信息:如果a
ij
=1,那么节点集合V中第j篇推文v
j
转发了推文v
i
,推文v
j
有一条指向v
i
的有向边;将源数据集R中的推文按照步骤1中计算出的重要性评分从大到小排序,取前A条推文构成初始数据集F,并对这A条推文打上标签1,源数据集R中的其他推文打上标签0;根据初始数据集F中的推文,利用源数据集R所构建的转发级联,通过初始数据集F中的推文Id和上级推文Id构建出若干个转发级联G
i
,且每个转发级联都有对应的根节点r
i
;步骤3:数据集随机生长:根据初始数据集F构建的多个转发级联G
i
,从数据集R

F中找出能够连接所述转发级联G
i
的节点所对应的推文N
k
,并将推文N
k
加入到初始数据集F中,使所有转发级联G
i
生长为一个整体转发级联G

,且对应的初始数据集变为完整初始数据集F

;根据整体转发级联G

,从数据集R

F

中随机选择部分推文SN
i
,直接添加进入整体转发级联G

作为新的节点,生成增广转发级联GZ,并对应形成中间数据集M,其中完整初始数据集F

和随机生长的数据集M

F

的推文数量比为B;根据增广转发级联GZ,从数据集R

M中随机选择部分推文添加进入增广转发级联GZ作为新的节点,生成最终转发级联GF,并对应形成最终数据集L,其中完整初始数据集F

和随机生长的数据集L

F

的推文数量比为C;步骤4:模型训练:
将所述最终数据集L的前D个推文携带标签,剩余推文不携带标签,并作为训练集投入图卷积神经网络进行半监督训练;步骤5:将待检测的数据集投入训练好的图卷积神经网络中,输出数据集中每条推文的标签,根据标签判断推文是否为关键推文;统计待检测的数据集中的每位作者发布的推文数量以及其中关键推文数量,得到关键推文占比Rate,根据关键推文占比确定关键转发者。2.根据权利要求1所述一种基于随机生长的社交网络关键转发者检测方法,其特征在于:步骤1中,推文特征和推文作者特征为:推文特征和推文作者特征为:
3.根据权利要求2所述一种基于随机生长的社交网络关键转发者检测方法,其特征在于:步骤1中,根据推文作者的特征计算得到的影响力计算公式...

【专利技术属性】
技术研发人员:殷茗周文博宋志昕姚王梓胡季傲杜熙琚翔邓乐
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1