【技术实现步骤摘要】
一种面向传播不确定性的谣言检测方法及装置
[0001]本专利技术涉及数据挖掘
,具体涉及一种面向传播不确定性的谣言检测方法及装置。
技术介绍
[0002]在新媒体时代,社交媒体网站为用户获取信息、表达意见和相互交流提供了巨大的便利。越来越多的用户热衷于参与社交媒体中热点话题的讨论,并且由于平台的便利性等,使得用户生成内容可以迅速达到广泛受众。然而,社交媒体中也滋生了大量谣言信息的产生与传播,给社会带来危害,严重影响着人们的日常生活和社会的健康发展。因此,如何及时准确地检测出谣言是社交网络分析领域中一个迫切需要的研究课题,有重要的研究意义和现实应用意义。
[0003]随着时间的推移,源博文通过一系列的转发或回复传播关系形成了其特定的传播结构。现有研究发现,与真实信息相比,谣言的传播更快、更广、更深。这些结构特征为研究者利用传播数据检测谣言提供了可能。随着深度学习(Deep Learning)和数据挖掘(DataMining)技术的发展,许多方法将源博文的传播数据建模为树结构或图结构,利用深度学习工具学习源博文的特征表示,构建分类器进行检测。
[0004]但是,在日益复杂的现代社会,以用户为主要参与者的信息传播具有一定程度的随机性。新用户建立信息传播渠道的随机性、已有用户在从众心理、群体压力等因素作用下产生的无意识传播行为与非理性传播行为等,以及一些不法分子的恶意、虚假等传播行为,在这种环境下,表面上的信息传播路径包含许多噪声,这些使得构建的显式图结构(关系)不一定反映真实的依赖传播关系。这种可观测 ...
【技术保护点】
【技术特征摘要】
1.一种面向传播不确定性的谣言检测方法,其步骤包括:1)获取社交网络中源博文与转发博文的文本数据及若干传播数据,并基于文本数据提取的文本特征,利用传播数据分别构建传播方向的初始传播图G
′
TD
及扩散方向的初始传播图G
′
BU
;2)对于初始传播图G
′
TD
与初始传播图G
′
BU
,分别利用图卷积网络对边的可靠性进行评估,生成传播图G
TD
与传播图G
BU
;3)基于传播图G
TD
与传播图G
BU
中的节点表示片
TD
与片
BU
,生成源博文的最终特征表示,以获取谣言检测结果。2.如权利要求1所述的方法,其特征在于,传播数据包括源博文与转发博文之间及转发博文之间的传播关系集合;文本特征包括:TF
‑
IDF文本特征。3.如权利要求1所述的方法,其特征在于,通过以下步骤生成传播图G
TD
:1)利用图卷积网络聚合初始传播图G
′
TD
中节点的邻域特征,获取节点的特征表示;2)基于特征表示及贝叶斯概率公式,计算边的可靠性分数;3)根据可靠性分数,调整初始传播图G
′
TD
中边的权重,生成调整后传播图G
″
TD
;4)利用图卷积网络聚合调整后传播图G
″
TD
中节点的邻域特征,将具有潜在关系驱动的邻域特征的归一化和,通过生成的节点表示片
TD
...
【专利技术属性】
技术研发人员:周薇,卫玲蔚,胡斗,虎嵩林,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。