一种基于新闻-评论关联性分析的虚假新闻识别方法技术

技术编号：25550856 阅读：29 留言：0更新日期：2020-09-08 18:50

本发明专利技术属于新闻检测领域，具体涉及一种基于新闻‑评论关联性分析的虚假新闻识别方法，包括：基于新闻中各文本子句内容构建二维新闻特征矩阵，以及根据各条评论的内容构建该条评论的一维特征向量，并将每条初始评论作为根节点、每条回复评论作为子节点构建多个评论树；将每个评论树中每个节点特征向量与其父节点上下文关联特征向量结合，计算该评论树中所有叶子节点上下文关联特征向量并加权计算，得到评论树特征向量，所有评论树特征向量构成二维评论特征矩阵；匹配新闻特征矩阵与评论特征矩阵间的关联性，得到新闻特征向量和评论特征向量，以判断新闻真实性。本发明专利技术充分利用新闻文本及其在传播过程中产生的信息，精确度强，适应大规模社交网络。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于新闻-评论关联性分析的虚假新闻识别方法
本专利技术属于新闻检测领域，更具体地，涉及一种基于新闻-评论关联性分析的虚假新闻识别方法。
技术介绍
网络技术的蓬勃发展使得信息的获取成本越来越低，网络技术无处不在也为社交网络的兴起提供了基础。用户可以轻松便捷的从社交网络中获取和发布信息，这种便利性降低了虚假新闻产生和传播的门槛。虚假新闻会利用信息披露的不及时性，通过社交网络的疯狂传播造成严重的舆论压力和社会恐慌。虚假新闻严重影响社交网络环境，制造群体焦虑，因此对于社交网络中虚假新闻的有效识别是当前社会背景下亟待解决的问题。虚假新闻的识别工作主要针对新闻文本。主要涉及两方面，(1)对新闻中所涉及到的知识提取，与知识图库进行比较；(2)对文本语句进行语法分析，对其中涉及到的表述是否经常出现不确定的描述来进行判断。随着社交网络的兴起，如何合理的利用社交网络信息，提高新闻真实性识别能力，成为了最值得探讨的问题。所以最近开始有分析方法将重点放在传播过程或评论文本上，(1)从宏观和微观领域分析传播过程，根据其传播规模推断新闻真实性；(2)根据传播路径中用户的受信任程度，获得传播网络中用户质量的评级，进而判断新闻的真实性；(3)根据评论中观点的冲突程度分析新闻的真实性，引发激烈讨论且具有冲突意见的观点能够让人对信息的真实性产生足够的怀疑，通过模仿人类理解信息的过程，获得了一定的效果。然而现有方法只注重新闻文本或只关注传播过程的形式，它过于依赖于新闻内容本身，而且对于当前知识匮乏的全新领域，很难有良好的适应性。社交机器人的出...

【技术保护点】
1.一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，包括：/nS1、基于待识别新闻内容构建其新闻特征矩阵，以及基于待识别新闻的每条评论的内容构建该条评论的特征向量；同时根据评论间回复关系，将每条初始评论作为根节点、每条回复评论作为子节点构建多个评论树；/nS2、将每个评论树中每个节点的所述特征向量与其父节点的上下文关联特征向量相关联，通过递归计算得到该评论树所有叶子节点的上下文关联特征向量并进行加权计算，得到该评论树的特征向量；/nS3、匹配所述新闻特征矩阵与所有评论树的特征向量之间的关联性，得到考虑评论的新闻子句间注意力权重，用于对所述新闻特征矩阵中各文本子句对应的向量之间进行加权得到新闻特征向量，以及得到考虑新闻的评论树间注意力权重，用于对各评论树的特征向量之间进行加权得到评论特征向量，基于新闻特征向量和评论特征向量判断新闻的真实性。/n

【技术特征摘要】
1.一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，包括：
S1、基于待识别新闻内容构建其新闻特征矩阵，以及基于待识别新闻的每条评论的内容构建该条评论的特征向量；同时根据评论间回复关系，将每条初始评论作为根节点、每条回复评论作为子节点构建多个评论树；
S2、将每个评论树中每个节点的所述特征向量与其父节点的上下文关联特征向量相关联，通过递归计算得到该评论树所有叶子节点的上下文关联特征向量并进行加权计算，得到该评论树的特征向量；
S3、匹配所述新闻特征矩阵与所有评论树的特征向量之间的关联性，得到考虑评论的新闻子句间注意力权重，用于对所述新闻特征矩阵中各文本子句对应的向量之间进行加权得到新闻特征向量，以及得到考虑新闻的评论树间注意力权重，用于对各评论树的特征向量之间进行加权得到评论特征向量，基于新闻特征向量和评论特征向量判断新闻的真实性。

2.根据权利要求1所述的一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，所述新闻特征矩阵的构建方法具体为：
获取待识别新闻的文本内容并对其分句分词，将分词后的单词进行词向量转换；采用循环神经网络将所有所述词向量转换为关联上下文信息的隐状态向量；采用注意力机制，对所述分句得到的每个子句所对应的所有所述隐状态向量进行加权，将该子句表示为一维特征向量，所有子句的特征向量构成待识别新闻的二维新闻特征矩阵。

3.根据权利要求2所述的一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，所述根据待识别新闻的每条评论的内容构建该条评论的一维特征向量，具体为：
获取每条评论的文本内容并对其分词，将分词后的单词进行词向量转换；采用循环神经网络将所有所述词向量转换为关联上下文信息的隐状态向量；采用注意力机制，对所有所述隐状态向量进行加权，将该条评论表示成一维特征向量。

4.根据权利要求3所述的一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，所述S1中的所有所述循环神经网络为双向长短期记忆网络。

5.根据权利要求1至4任一项所述的一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，所述S2中，采用门循环单元通过递归计算，得到所述所有叶子节点的上下文关联特征向量。

6.根据权利要求5所述的一种基于新闻-评论关联性分析的虚假新闻识别方法，其特征在于，所述S2中，每个评论树的特征向量构建方法为：
基于门循环单元，对每个评论树自顶向下，...

【专利技术属性】
技术研发人员：李玉华，张文杰，李瑞轩，辜希武，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人