基于决策树与共同注意力协作的假新闻检测系统及方法技术方案

技术编号:25398049 阅读:43 留言:0更新日期:2020-08-25 23:02
本发明专利技术公开了一种基于决策树与共同注意力协作的假新闻检测系统及方法,本发明专利技术从一个新角度,提供了一种传统透明的机器学习与神经网络模型相结合的方法,提出了一种基于决策树与共同注意力协作的可解释性假新闻检测方法,来透明地捕获有力的细粒度证据并通过这些证据来发掘假新闻的虚假部分。本发明专利技术不仅提高了假新闻检测性能,还提供了检测过程的透明性以及检测结果的可解释性。本发明专利技术为假新闻检测任务提出了一种透明的、可解释的方案,该方案将决策树模型合并到共同注意网络中,不仅可以提供可解释索赔验证的证据,同时通过判决条件对证据形成过程进行了解释。本发明专利技术具有可拆解性,可将本发明专利技术的两个模块解耦训练利用,具有模型泛化能力和任务阶段性训练能力。

【技术实现步骤摘要】
基于决策树与共同注意力协作的假新闻检测系统及方法
本专利技术属于电子信息
,涉及一种基于决策树与共同注意力协作的假新闻检测系统及方法。
技术介绍
假新闻检测的研究目前已经大致经历了两个研究阶段:第一个阶段是构建合适的深度模型围绕帖子或新闻的文本内容挖掘语义特征、情感特征、写作风格特征、立场特征等,以及围绕新闻的社会上下文来抽取基于来源的,基于帖子的,基于用户的,基于网络的可信度指示性特征来提高假新闻的检测性能。尽管这些方法体现了强大的有效性,但他们很难解释为什么被检测新闻是真实的还是虚假的。为克服这些弊端,最近研究的一个流行趋势(第二个阶段)是探索基于证据的解决方案,其聚焦于借助合理的神经网络模型从可靠的来源中捕获相关的证据片段来进行可解释性的假新闻检测。然而,尽管这种方法体现了一定的可解释性,但仍然存在一些限制:第一,他们很难解释新闻的证据发现过程,因为这种方法是神经网络模型,属于非透明的黑盒模型,缺乏方法本身的可解释性;第二,提供的证据是粗粒度的,通常是面向新闻的整条序列,缺乏对新闻序列中真正虚假部分的聚焦。【本文档来自技高网...

【技术保护点】
1.基于决策树与共同注意力协作的假新闻检测系统,其特征在于,包括:/n基于决策树的证据模型,用于将多种因素作为决策条件并选择高可信度评论作为证据;/n共同注意力模型,用于使被选中的证据与待检测新闻进行深层语义交互;/n任务学习模块,用于将深度语义交互信息输入到Softmax中进行概率分布的预测。/n

【技术特征摘要】
1.基于决策树与共同注意力协作的假新闻检测系统,其特征在于,包括:
基于决策树的证据模型,用于将多种因素作为决策条件并选择高可信度评论作为证据;
共同注意力模型,用于使被选中的证据与待检测新闻进行深层语义交互;
任务学习模块,用于将深度语义交互信息输入到Softmax中进行概率分布的预测。


2.基于决策树与共同注意力协作的假新闻检测方法,其特征在于,包括以下步骤:
步骤0:给定数量为N的数据集其中,xi指一条待检测可信度的新闻,Ri为包含m条相关评论的集合Ri={R1,R2,…,Rm},yi表示真假二分类标签;
步骤1:构建基于层次性评论构建树形网络;
树形网络的根节点是该验证的新闻,第二层节点为用户对该新闻的直接评论R11,R12,…,Rkn;其中k和n分别表示树形网络的深度和最后一层的节点宽度,第三层及以下节点是按照现实情况下层次性评论中对评论的回复进行建立的;
步骤2:构建基于可信度视角的决策树来选择树形网络中具有高可信度的评论作为证据;其中,决策树中每个决策节点包括一个决策条件和两个决策边;
步骤3:当树形网络中评论节点被决策树模型进行评估后,利用后剪枝算法选择树形网络子树作为证据集来用于后续的训练;
步骤4:采用共同注意力模型使选择的证据与新闻进行交互;
步骤5:对证据序列与新闻序列进行嵌入表示;
对于任意一条长度为l的序列X={x1,x2,…,xl},其中,每个词的嵌入xi是一个由预训练BERT模型获得的d维向量;最终形成新闻嵌入序列Xc和证据嵌入序列Xe;
步骤6:对序列进行编码;
采用BiLSTM模型对新闻嵌入序列Xc和证据嵌入序列Xe进行编码,如下:









其中,和分别是前向LSTM和后向LSTM的隐藏层,h是LSTM的隐藏层单元,表示拼接操作;最终,获得新闻序列的编码以及证据序列的编码
步骤7:证据编码与新闻编码通过共同自注意力进行深度语义交互;共同自注意力构建了两个层次自注意力网络;其中,自注意力网络如下:



其中,和分别为查询矩阵,键矩阵以及值矩阵;d是K的尺度值;在第一个层次自注意力网络中,是证据序列编码的最大池化向量,K=V=Rc...

【专利技术属性】
技术研发人员:饶元吴连伟张聪李薛
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1