一种基于微博事件关系的谣言检测方法及其系统技术方案

技术编号:27975864 阅读:44 留言:0更新日期:2021-04-06 14:10
本发明专利技术公开了一种基于微博事件关系的谣言检测方法,包括:步骤S1、构建微博数据集,步骤S2、得到特征矩阵;步骤S3、构建微博事件关系图,再通过微博事件关系图得到邻接矩阵;步骤S4、将特征矩阵以及邻接矩阵输入图卷积神经网络模型进行训练,然后得到最终的谣言检测模型;步骤S5、根据最终的谣言检测模型进行谣言检测。本发明专利技术还公开了一种基于微博事件关系的谣言检测系统,该系统包括:微博数据集构建模块、微博预处理模块、微博关系模块、微博检测模块;本发明专利技术通过用户行为信息,得到了微博事件之间联系的紧密关系,提高了谣言检测的正确率。

【技术实现步骤摘要】
一种基于微博事件关系的谣言检测方法及其系统
本专利技术涉及基于深度学习的谣言检测,特别是涉及一种基于微博事件关系的谣言检测方法及其系统。
技术介绍
谣言是在人和人之间传播的,其真实性不能及时得到证明或是无法证明的一种特殊陈述,往往会带来恶劣的影响。由于社交媒体的快速发展,每个普通人都可以成为信息的发布源,就会造成网络中信息质量的良莠不齐,使得谣言可以在社会中快速而广泛地传播。因此对谣言的检测任务具有现实意义。使用传统的机器学习方法大多是通过选取人工特征,主要包括文本特征、用户特征以及传播特征,并使用包括贝叶斯、支持向量机、决策树等分类器来对事件进行学习分类。由于人工设计特征往往不能获得全部的特征,因此检测效果不佳,并且泛化能力较差,还会带来设计特征造成的人力、物力的消耗。近年来随着深度学习的快速发展,深度学习模型包括卷积神经网络、循环神经网络等来解决自然语言处理任务,逐步取得了显著的成果,预训练模型包括BERT、XLNET等也在自然语言处理任务中有着非常优秀的表现,并且与传统的机器学习模型相比,深度学习模型对人工特征的依赖较小。本文档来自技高网...

【技术保护点】
1.一种基于微博事件关系的谣言检测方法,其特征在于,包括如下步骤:/n步骤S1、构建微博数据集,所述微博数据集E={e

【技术特征摘要】
1.一种基于微博事件关系的谣言检测方法,其特征在于,包括如下步骤:
步骤S1、构建微博数据集,所述微博数据集E={e1,e2,...,en}包括n个微博事件的文本信息以及用户行为信息;
步骤S2、对每个微博事件对应的文本信息进行预处理,然后再依次输入预训练模型以及卷积神经网络模型,得到每个微博事件的特征向量,在将微博数据集中所有微博事件的特征向量组合得到特征矩阵;
步骤S3、根据所述用户行为信息构建微博事件关系图,再通过微博事件关系图得到邻接矩阵;
步骤S4、将步骤S2得到的特征矩阵以及步骤S3得到的邻接矩阵输入图卷积神经网络模型来完成模型的训练,然后得到最终的谣言检测模型;
步骤S5、将微博事件输入步骤S4得到的谣言检测模型判断是否为谣言。


2.根据权利要求1所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S2具体包括:
步骤S201、通过预处理除去微博事件ei对应的文本信息中与内容无关的停用词;
步骤S202、将经过预处理后的文本信息作为输入,输入至预训练模型中得到向量vi;
步骤S203、将向量vi输入至卷积神经网络中得到特征向量pi;
步骤S204、重复步骤S201至步骤S203,得到微博数据集中所有微博事件的特征向量,并且将所述特征向量组合成特征矩阵X∈Rn×m,n表示微博事件数,m表示特征向量的维度。


3.根据权利要求2所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S203具体包括:
步骤S2031、通过卷积层选取宽度与向量vi维度等长的卷积核,使得卷积核始终保持在竖直方向滑动,进行对向量的卷积操作,得到与卷积核数量相同的特征向量ci;
步骤S2032、再通过池化层对特征向量ci进行最大池化操作,提取局部接受域中向量的最大值,得到特征向量pi;
步骤S2033、通过全连接层对特征向量pi和分类标签进行全连接操作,得到微博事件ei的预测标签,并且保存特征向量pi作为微博事件ei的特征向量。


4.根据权利要求3所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S3具体包括:
步骤S301、提取微博数据集中的用户行为信息,包括对每个微博事件进行评论或转发的用户ID;
步骤S302、根据步骤S301得到用...

【专利技术属性】
技术研发人员:宋玉蓉王昕岩
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1