一种基于微博事件关系的谣言检测方法及其系统技术方案

技术编号：27975864 阅读：44 留言：0更新日期：2021-04-06 14:10

本发明专利技术公开了一种基于微博事件关系的谣言检测方法，包括：步骤S1、构建微博数据集，步骤S2、得到特征矩阵；步骤S3、构建微博事件关系图，再通过微博事件关系图得到邻接矩阵；步骤S4、将特征矩阵以及邻接矩阵输入图卷积神经网络模型进行训练，然后得到最终的谣言检测模型；步骤S5、根据最终的谣言检测模型进行谣言检测。本发明专利技术还公开了一种基于微博事件关系的谣言检测系统，该系统包括：微博数据集构建模块、微博预处理模块、微博关系模块、微博检测模块；本发明专利技术通过用户行为信息，得到了微博事件之间联系的紧密关系，提高了谣言检测的正确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于微博事件关系的谣言检测方法及其系统
本专利技术涉及基于深度学习的谣言检测，特别是涉及一种基于微博事件关系的谣言检测方法及其系统。
技术介绍
谣言是在人和人之间传播的,其真实性不能及时得到证明或是无法证明的一种特殊陈述，往往会带来恶劣的影响。由于社交媒体的快速发展，每个普通人都可以成为信息的发布源，就会造成网络中信息质量的良莠不齐，使得谣言可以在社会中快速而广泛地传播。因此对谣言的检测任务具有现实意义。使用传统的机器学习方法大多是通过选取人工特征，主要包括文本特征、用户特征以及传播特征，并使用包括贝叶斯、支持向量机、决策树等分类器来对事件进行学习分类。由于人工设计特征往往不能获得全部的特征，因此检测效果不佳，并且泛化能力较差，还会带来设计特征造成的人力、物力的消耗。近年来随着深度学习的快速发展，深度学习模型包括卷积神经网络、循环神经网络等来解决自然语言处理任务，逐步取得了显著的成果，预训练模型包括BERT、XLNET等也在自然语言处理任务中有着非常优秀的表现，并且与传统的机器学习模型相比，深度学习模型对...

【技术保护点】
1.一种基于微博事件关系的谣言检测方法，其特征在于，包括如下步骤：/n步骤S1、构建微博数据集，所述微博数据集E＝{e

【技术特征摘要】
1.一种基于微博事件关系的谣言检测方法，其特征在于，包括如下步骤：
步骤S1、构建微博数据集，所述微博数据集E＝{e1,e2,...,en}包括n个微博事件的文本信息以及用户行为信息；
步骤S2、对每个微博事件对应的文本信息进行预处理，然后再依次输入预训练模型以及卷积神经网络模型，得到每个微博事件的特征向量，在将微博数据集中所有微博事件的特征向量组合得到特征矩阵；
步骤S3、根据所述用户行为信息构建微博事件关系图，再通过微博事件关系图得到邻接矩阵；
步骤S4、将步骤S2得到的特征矩阵以及步骤S3得到的邻接矩阵输入图卷积神经网络模型来完成模型的训练，然后得到最终的谣言检测模型；
步骤S5、将微博事件输入步骤S4得到的谣言检测模型判断是否为谣言。

2.根据权利要求1所述的一种基于微博事件关系的谣言检测方法，其特征在于，所述步骤S2具体包括：
步骤S201、通过预处理除去微博事件ei对应的文本信息中与内容无关的停用词；
步骤S202、将经过预处理后的文本信息作为输入，输入至预训练模型中得到向量vi；
步骤S203、将向量vi输入至卷积神经网络中得到特征向量pi；
步骤S204、重复步骤S201至步骤S203，得到微博数据集中所有微博事件的特征向量，并且将所述特征向量组合成特征矩阵X∈Rn×m，n表示微博事件数,m表示特征向量的维度。

3.根据权利要求2所述的一种基于微博事件关系的谣言检测方法，其特征在于，所述步骤S203具体包括：
步骤S2031、通过卷积层选取宽度与向量vi维度等长的卷积核，使得卷积核始终保持在竖直方向滑动，进行对向量的卷积操作，得到与卷积核数量相同的特征向量ci；
步骤S2032、再通过池化层对特征向量ci进行最大池化操作，提取局部接受域中向量的最大值，得到特征向量pi；
步骤S2033、通过全连接层对特征向量pi和分类标签进行全连接操作，得到微博事件ei的预测标签，并且保存特征向量pi作为微博事件ei的特征向量。

4.根据权利要求3所述的一种基于微博事件关系的谣言检测方法，其特征在于，所述步骤S3具体包括：
步骤S301、提取微博数据集中的用户行为信息，包括对每个微博事件进行评论或转发的用户ID；
步骤S302、根据步骤S301得到用...

【专利技术属性】
技术研发人员：宋玉蓉，王昕岩，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人