基于用户短时情感和演化博弈的网络谣言传播预测方法技术

技术编号:35942547 阅读:11 留言:0更新日期:2022-12-14 10:31
本发明专利技术提出了基于用户短时情感和演化博弈的网络谣言传播预测方法,属于数据处理领域。所述方法包括获取社交网络平台的用户基本信息、用户行为数据和用户文本数据,并进行预处理;计算得到用户自身属性、用户影响力、用户话题参与度、消息流行度、好友驱动力和消息情感分数;并计算出谣言影响力和辟谣影响力,通过演化博弈的方式得到相互影响力;采用节点嵌入算法将用户节点映射到向量空间,采用基于相互影响力的CSR2Vec算法生成特征拓扑矩阵;将特征拓扑矩阵和用户邻接矩阵进行拼接,得到特征向量矩阵;将特征向量矩阵输入到带有注意力机制的图注意力网络模型中,输出用户的传播预测结果;本发明专利技术可应用谣言控制,绿色网络安全等多个领域。等多个领域。等多个领域。

【技术实现步骤摘要】
基于用户短时情感和演化博弈的网络谣言传播预测方法


[0001]本专利技术属于社交网络平台的数据处理领域,主要涉及到用户影响力发现,用户行为分析,特别是基于用户短时情感和演化博弈的网络谣言传播预测方法。

技术介绍

[0002]谣言是一种复杂的社会现象,其具有两个非常明显的特征:重要性和模糊性。谣言通常是一些没有经过证实的而被大多数人四处传播的信息。在现实生活中,人们无法靠自己去证实信息地真假,而往往会随着周围人改变自己内心地看法,产生从众心理。很多谣言经过大规模地传播,被人们认为是真实的。当谣言在我们的社会中广泛传播,往往会导致人们心中恐慌,造成社会不稳定的局面,这一系列的影响对建设我国稳定的社会环境是具有危害性的。
[0003]随着科学技术的不断更新和迭代,人们的交流方式已经发生了翻天覆地的变化。从最开始的线下交流聊天,到如今广泛使用的在线交流平台,科学技术的发展正在逐步地改变人们的生活习惯。现如今,数以亿计的网名都会使用手机,平板,电脑等设备在网上发表言论。设备的便捷性、适用性,大幅度地增加了网民上网浏览信息的时间。网民足不出户,就可以知晓最新的热点事件,在线聊天平台的互动性,让用户得到最真实的感受。而随着移动通信技术的快速发展,网络平台的建设也踏上了更高水准的阶段,可以承载更高的负载,也可以提供用户更快的更新速度,给用户带来更佳的体验感。
[0004]然而,事物总是具有两面性。例如微博这种的大型在线网络交流平台,给用户带来消息分享的便捷性,但也给社会带来一些潜在的危险。由于微博庞大的用户量,对于网络平台的监控,则变得更加困难。在一个热点事件爆发的时候,往往会有大量的用户加入话题的讨论。由于用户传播消息的随意性,我们往往会接收到一些与事实不相符的消息,这就是我们常说的谣言。在话题传播中,往往夹杂着大量的谣言消息,而谣言消息相比于正常消息传播更为迅速,范围也更广。
[0005]近些年来,国内外的研究者们都对谣言传播领域进行了深入的研究。在研究模型方面,最早的是以社会网络分析和数学模型为基础,基于用户节点,来进行谣言传播模型的研究,其中传染病(SIR)模型即为最基本的模型。另一方面就是以机器学习和深度学习相结合的针对于谣言传播特征方面的角度来开展研究。在研究角度方面,一部分研究学者主要从用户自身特征方面开展谣言的研究,从用户自身出发,考虑用户的历史传播行为和用户的自身特点,来预测谣言对用户的吸引程度。另外一部分研究学者基于谣言的传播空间方面开展谣言对用户的转发行为进行预测。这些研究者们都取得了不错的成果。
[0006]虽然研究者们对谣言话题的传播预测已经取得一定的成果,但仍然还存在一些挑战:
[0007]1.用户与谣言消息的情感关联性。消息传播空间下,某一特定时间段内,谣言消息的情感会较大程度上影响用户的行为,如何量化用户与消息的情感影响力是需要解决的问题。
[0008]2.谣言消息特征空间的复杂性和多样性。谣言传播空间下,用户,消息,网络,行为的复杂性和多样性,为有效地表达谣言特征带来了困难,从而影响了模型的预测准确率。
[0009]3.谣言消息的合作性与对立性。在谣言传播空间下,谣言消息和辟谣消息同时存在。用户的行为极大程度上受两种消息的影响,如何衡量谣言消息和辟谣消息对用户行为的影响,是研究者们需要考虑的问题。

技术实现思路

[0010]针对以上挑战,本专利技术提出一种基于用户短时情感和演化博弈的网络谣言传播预测方法。本专利技术引入演化博弈论,在个体层面和群体层面来探究影响谣言消息传播的因素,最后建立用户对谣言消息的行为预测模型,并分析在不同的时间段内,参与话题传播的群体行为,研究谣言在其生命周期内的演化规律。
[0011]一种基于用户短时情感和演化博弈的网络谣言传播检测方法,所述方法包括:
[0012]获取社交网络平台的用户基本信息、用户行为数据和用户文本数据,并对获取的数据进行预处理;
[0013]根据预处理后的用户基本信息和用户行为数据,分别计算出用户自身属性、用户影响力、用户话题参与度、消息流行度和好友驱动力;
[0014]根据预处理后的用户文本数据,采用TF

IDF算法生成词频特征,利用情感分类器对词频特征进行处理,生成消息情感分数;
[0015]根据用户自身属性、用户影响力、用户话题参与度、消息流行度、消息情感分数和好友驱动力,采用多元回归线性算法计算出谣言影响力和辟谣影响力;
[0016]根据谣言影响力和辟谣影响力分别计算出用户转发谣言信息和转发辟谣信息的策略收益,并采用演化博弈模型度量谣言信息和辟谣信息的相互影响力;
[0017]采用节点嵌入算法将用户节点映射到向量空间,采用基于相互影响力的随机游走算法生成话题网络的特征拓扑矩阵;
[0018]将话题网络的特征拓扑矩阵和用户邻接矩阵进行拼接,融合形成特征向量矩阵;
[0019]将融合后的特征向量矩阵输入到带有注意力机制的图注意力网络模型中,输出用户不参与谣言话题、或者转发谣言信息或者转发辟谣信息的预测结果。话题网络的特征拓扑矩阵话题网络的特征拓扑矩阵
[0020]本专利技术的有益效果:
[0021]本专利技术采集用户的个人信息、用户历史行为记录、用户文本内容等记录,并且创建用户交互矩阵,也即邻接矩阵,能够有效地表达用户之间的交互关系。通过设计了一种学习话题的新方法CSR2Vec算法(基于相互影响力的随机游走算法),将特征空间低秩稠密矢量化,有效地解决用户数据稀疏性问题。同时,本专利技术将用户情感因素和演化博弈论结合,充分考虑用户面对谣言时的情绪因素,提高预测用户是否转发谣言的准确性。最后、使用带有注意力机制的图神经网络,更好地处理动态图结构,通过对用户行为的结果,能够有效预测群体行为,进一步判断谣言的发展趋势。
附图说明
[0022]图1是本专利技术实施例的基于用户短时情感和演化博弈的网络谣言传播模型结构
图;
[0023]图2是本专利技术实施例的基于用户短时情感和演化博弈的网络谣言传播方法流程图;
[0024]图3是本专利技术实施例的文本表示示意图;
[0025]图4是本专利技术实施例的特征拓扑矩阵结构表示示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]为了更好地阐述本专利技术的技术方案并使优点更加简明清晰,下面先对本专利技术要解决的问题进行具体解释,再参照说明书附图,对本专利技术的具体实施方式做进一步详细说明。
[0028]图1是本专利技术实施例的基于用户短时情感和演化博弈的网络谣言传播模型结构图;如图1所示,表明本专利技术的输入是社交网络平台的用户基本信息、用户行为数据和用户文本数据,经过演化博弈处理后得到谣言信息和辟谣本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户短时情感和演化博弈的网络谣言传播预测方法,其特征在于,所述方法包括:获取社交网络平台的用户基本信息、用户行为数据和用户文本数据,并对获取的数据进行预处理;根据预处理后的用户基本信息和用户行为数据,分别计算出用户自身属性、用户影响力、用户话题参与度、消息流行度和好友驱动力;根据预处理后的用户文本数据,采用TF

IDF算法生成词频特征,利用情感分类器对词频特征进行处理,生成消息情感分数;根据用户自身属性、用户影响力、用户话题参与度、消息流行度、消息情感分数和好友驱动力,采用多元回归线性算法计算出谣言影响力和辟谣影响力;根据谣言影响力和辟谣影响力分别计算出用户转发谣言信息和转发辟谣信息的策略收益,并采用演化博弈模型度量谣言信息和辟谣信息的相互影响力;采用节点嵌入算法将用户节点映射到向量空间,采用基于相互影响力的随机游走算法生成话题网络的特征拓扑矩阵;将话题网络的特征拓扑矩阵和用户邻接矩阵进行拼接,融合形成特征向量矩阵;将融合后的特征向量矩阵输入到带有注意力机制的图注意力网络模型中,输出用户不参与谣言话题、或者转发谣言信息或者转发辟谣信息的预测结果。2.根据权利要求1所述的一种基于用户短时情感和演化博弈的网络谣言传播预测方法,其特征在于,所述根据预处理后的用户文本数据,采用TF

IDF算法生成词频特征,利用情感分类器对词频特征进行处理,生成消息情感分数包括对预处理后的用户文本数据进行时间切片处理,选择用户在某时间段内转发、点赞以及评论的文本集合;采用TF

IDF算法对用户在某时间段内的文本集合进行词频处理,生成用户在某时间段的词频特征,将所述词频特征输入情感分类器中,生成用户在某时间段内的消息情感分数。3.根据权利要求1或2所述的一种基于用户短时情感和演化博弈的网络谣言传播预测方法,其特征在于,谣言影响力和辟谣影响力分别表示为:谣言影响力和辟谣影响力分别表示为:其中,influence
rumor
(u
i
,u
j
)表示用户u
i
和用户u
j
之间的谣言影响力,influence
anti

rumor
(u
i
,u
j
)表示用户u
i
和用户u
j
之间的辟谣影响力,分别为使用多元线性回归算法训练得来的偏回归系数,表示在训练过程中整体影响系数,表示用户因素在训练过程中对用户行为的影响系数,表示消息因素在训练过程中对用户行为的影响系数;userfactor(u
i
)表示用户u
i
的用户因素,userfactor(u
i
)=User(u
i
)*userInfluence(u
i
)*participate(u
i
),User(u
i
)表示用户u
i
的自身属性,userInfluence(u
i
)表示用户u
i
的影响力,participate(u
i
)表示用户u
i
话题参与度;mesfactors
rumor
(u
i
,u
j
)表示用户u
i
和用户u
j
之间传播谣言消息的消息因素,mesfactors
anti

rumor
(u
i
,u
j
)表示用户u
i
和用户u
j
之间传播辟谣消息的消息因素,Popularity(t)表示谣言消息或者辟谣消息在t时...

【专利技术属性】
技术研发人员:肖云鹏曾聪庞育才李茜李暾王蓉王佐成陶禹冲谢宇峰
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1