一种网络谣言识别方法及系统技术方案

技术编号:27059527 阅读:16 留言:0更新日期:2021-01-15 14:39
本发明专利技术涉及一种网络谣言识别方法即系统,方法包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,图结构中的节点为多个文本,图结构中的邻接矩阵为谣言信息在多个文本之间的转发和评论关系;构建图卷积神经网络模型;图卷积神经网络模型的输入为文本特征矩阵和邻接矩阵,图卷积神经网络模型的输出为谣言特征矩阵;根据谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据谣言识别模型识别网络谣言。本发明专利技术根据谣言在多个文本之间的转发和评论关系训练图卷积神经网络模型,根据谣言特征矩阵训练神经网络模型,有效的捕获了谣言信息广泛且分散的传播特征,可以有效识别谣言信息。

【技术实现步骤摘要】
一种网络谣言识别方法及系统
本专利技术涉及网络谣言识别
,特别是涉及一种网络谣言识别方法及系统。
技术介绍
大数据环境下,在线社会网络与人们的生活、娱乐以及工作逐渐融为一体。社交媒体已经成为人们分享信息以及交流的平台,其信息繁杂,传播自由便捷,影响力大等特点,使其成为舆情爆发和升温的重要传播媒介。由于缺乏有效监管,谣言等虚假信息的泛滥会给政治、经济、文化等领域带来很大的威胁和影响,已成为在线社会网络诸多应用发展面临的主要瓶颈之一。社交媒体谣言识别任务引起自然语言处理、数据挖掘等领域研究者的强烈关注,它能够用于辅助预警、预防、监控、治理等谣言清除工作,因此社交媒体谣言识别是改善在线社会网络信息生态环境质量、提升用户体验的有效手段。目前有很多方法检测谣言。传统方法主要从人工定义特征的角度出发,主要通过构建相关谣言微博的特征,使用决策树或支持向量机等机器学习分类器进行事件分类,通用性较差。这种基于特征工程的方法虽然取得了一定的成效,但是需要耗费大量资源,并且受限于人工设计的规则。当今,随着深度学习的快速发展,基于深度神经网络模型在语义表示与谣言检测运用方面更具优势。神经网络模型与机器学习方法相比,能够自动从数据中学习事件特征,避免了大量的特征工程,在捕获上下文之间复杂的语义关系方面也有更好的拓展性。但目前神经网络谣言检测模型,大多在于学习更好的事件特征或语义信息,而现实生活中社交媒体的信息传播具有结构关系,因此神经网络模型检测谣言并不理想。
技术实现思路
本专利技术的目的是提供一种网络谣言识别方法及系统,以有效识别网络中传播的谣言信息。为实现上述目的,本专利技术提供了如下方案:一种网络谣言识别方法,包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据所述谣言识别模型识别网络谣言。可选地,所述根据包含谣言信息的多个文本得到文本特征矩阵,具体为:训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;根据所述词向量获取多个所述文本的第一词特征矩阵;将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。可选地,还包括:对多个所述文本进行清洗和长度规范化。可选地,所述训练包含谣言信息的多个文本中的单词,得到所述单词的词向量,具体为:根据Word2Vec中的Skip-Gram神经网络模型训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;其中所述Skip-Gram神经网络模型使用的窗口大小为5,所述词向量的嵌入维度为300。可选地,所述将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵,具体为:将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵;h为大于1的正整数;将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵。可选地,所述将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵,具体为:将所述第二词特征矩阵输入卷积层,得到卷积层特征;将所述卷积层特征输入最大池化层,得到所述文本特征矩阵。可选地,所述根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型,具体为:将所述谣言特征矩阵输入平均池化层、全连接层以及Softmax层得到谣言预测类别;根据所述谣言预测类别和真实谣言类别反向训练所述神经网络模型,得到谣言识别模型。可选地,所述根据所述谣言预测类别和真实谣言类别反向训练所述神经网络模型,得到谣言识别模型,具体为:获取所述谣言预测类别与所述真实谣言类别之间的差值;判断所述差值是否在预设阈值范围内;若是,则确定所述神经网络模型为所述谣言识别模型;若否,则根据所述差值反向训练所述神经网络模型,使所述差值在所述预设阈值范围内。一种网络谣言识别系统,包括:文本特征矩阵获取模块,用于根据包含谣言信息的多个文本得到文本特征矩阵;第一构建模块,用于构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;第二构建模块,用于构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;训练模块,用于根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;识别模块,用于根据所述谣言识别模型识别网络谣言。可选地,所述文本特征矩阵获取模块包括:训练单元,用于训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;获取单元,用于根据所述词向量获取多个所述文本的第一词特征矩阵;学习单元,用于将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;输入单元,用于将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术公开了一种网络谣言识别方法及系统,方法包括:根据包含谣言信息的多个文本得到文本特征矩阵;构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;根据所述谣言识别模型识别网络谣言。本专利技术根据谣言在多个文本之间的转发和评论关系训练图卷积神经网络模型,根据谣言特征矩阵训练神经网络模型,有效的捕获了谣言信息广泛且分散的传播特征,可以有效识别谣言信息。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1提供的网络谣言识别方法的流程图;图2为本专利技术实施例1提供的注意力机制原理图;图3为本专利技术实施例1提供的获得文本特征矩阵的卷积层和池化层原理图;图4为本专利技术实施例2提供的网络谣言识别方法的原理图;图5为本专利技术实施例3提供的网络谣言识别系统的系统框图。具体实施方式下面将结合本专利技术实施例中本文档来自技高网...

【技术保护点】
1.一种网络谣言识别方法,其特征在于,包括:/n根据包含谣言信息的多个文本得到文本特征矩阵;/n构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;/n构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;/n根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;/n根据所述谣言识别模型识别网络谣言。/n

【技术特征摘要】
1.一种网络谣言识别方法,其特征在于,包括:
根据包含谣言信息的多个文本得到文本特征矩阵;
构建传播图结构,所述图结构中的节点为多个所述文本,所述图结构中的邻接矩阵为所述谣言信息在多个所述文本之间的转发和评论关系;
构建图卷积神经网络模型;所述图卷积神经网络模型的输入为所述文本特征矩阵和所述邻接矩阵,所述图卷积神经网络模型的输出为谣言特征矩阵;
根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;
根据所述谣言识别模型识别网络谣言。


2.根据权利要求1所述的网络谣言识别方法,其特征在于,所述根据包含谣言信息的多个文本得到文本特征矩阵,具体为:
训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;
根据所述词向量获取多个所述文本的第一词特征矩阵;
将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;
将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。


3.根据权利要求2所述的网络谣言识别方法,其特征在于,还包括:
对多个所述文本进行清洗和长度规范化。


4.根据权利要求2所述的网络谣言识别方法,其特征在于,所述训练包含谣言信息的多个文本中的单词,得到所述单词的词向量,具体为:
根据Word2Vec中的Skip-Gram神经网络模型训练包含谣言信息的多个文本中的单词,得到所述单词的词向量;其中所述Skip-Gram神经网络模型使用的窗口大小为5,所述词向量的嵌入维度为300。


5.根据权利要求2所述的网络谣言识别方法,其特征在于,所述将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵,具体为:
将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵;h为大于1的正整数;
将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵。


6.根据权利要求2所述的网络谣言识别方法,其特征在于,所述将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵,具体为...

【专利技术属性】
技术研发人员:段大高白宸宇韩忠明刘文文张翙
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1