【技术实现步骤摘要】
一种基于微博事件关系的谣言检测方法及其系统
本专利技术涉及基于深度学习的谣言检测,特别是涉及一种基于微博事件关系的谣言检测方法及其系统。
技术介绍
谣言是在人和人之间传播的,其真实性不能及时得到证明或是无法证明的一种特殊陈述,往往会带来恶劣的影响。由于社交媒体的快速发展,每个普通人都可以成为信息的发布源,就会造成网络中信息质量的良莠不齐,使得谣言可以在社会中快速而广泛地传播。因此对谣言的检测任务具有现实意义。使用传统的机器学习方法大多是通过选取人工特征,主要包括文本特征、用户特征以及传播特征,并使用包括贝叶斯、支持向量机、决策树等分类器来对事件进行学习分类。由于人工设计特征往往不能获得全部的特征,因此检测效果不佳,并且泛化能力较差,还会带来设计特征造成的人力、物力的消耗。近年来随着深度学习的快速发展,深度学习模型包括卷积神经网络、循环神经网络等来解决自然语言处理任务,逐步取得了显著的成果,预训练模型包括BERT、XLNET等也在自然语言处理任务中有着非常优秀的表现,并且与传统的机器学习模型相比,深度学习模型对 ...
【技术保护点】
1.一种基于微博事件关系的谣言检测方法,其特征在于,包括如下步骤:/n步骤S1、构建微博数据集,所述微博数据集E={e
【技术特征摘要】
1.一种基于微博事件关系的谣言检测方法,其特征在于,包括如下步骤:
步骤S1、构建微博数据集,所述微博数据集E={e1,e2,...,en}包括n个微博事件的文本信息以及用户行为信息;
步骤S2、对每个微博事件对应的文本信息进行预处理,然后再依次输入预训练模型以及卷积神经网络模型,得到每个微博事件的特征向量,在将微博数据集中所有微博事件的特征向量组合得到特征矩阵;
步骤S3、根据所述用户行为信息构建微博事件关系图,再通过微博事件关系图得到邻接矩阵;
步骤S4、将步骤S2得到的特征矩阵以及步骤S3得到的邻接矩阵输入图卷积神经网络模型来完成模型的训练,然后得到最终的谣言检测模型;
步骤S5、将微博事件输入步骤S4得到的谣言检测模型判断是否为谣言。
2.根据权利要求1所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S2具体包括:
步骤S201、通过预处理除去微博事件ei对应的文本信息中与内容无关的停用词;
步骤S202、将经过预处理后的文本信息作为输入,输入至预训练模型中得到向量vi;
步骤S203、将向量vi输入至卷积神经网络中得到特征向量pi;
步骤S204、重复步骤S201至步骤S203,得到微博数据集中所有微博事件的特征向量,并且将所述特征向量组合成特征矩阵X∈Rn×m,n表示微博事件数,m表示特征向量的维度。
3.根据权利要求2所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S203具体包括:
步骤S2031、通过卷积层选取宽度与向量vi维度等长的卷积核,使得卷积核始终保持在竖直方向滑动,进行对向量的卷积操作,得到与卷积核数量相同的特征向量ci;
步骤S2032、再通过池化层对特征向量ci进行最大池化操作,提取局部接受域中向量的最大值,得到特征向量pi;
步骤S2033、通过全连接层对特征向量pi和分类标签进行全连接操作,得到微博事件ei的预测标签,并且保存特征向量pi作为微博事件ei的特征向量。
4.根据权利要求3所述的一种基于微博事件关系的谣言检测方法,其特征在于,所述步骤S3具体包括:
步骤S301、提取微博数据集中的用户行为信息,包括对每个微博事件进行评论或转发的用户ID;
步骤S302、根据步骤S301得到用...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。