一种虚假新闻检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:29459523 阅读:25 留言:0更新日期:2021-07-27 17:28
本申请涉及一种虚假新闻检测方法、装置、计算机设备和存储介质。所述方法包括:将新闻内容低维矢量输入到基于注意力加权的双向GRU网络,通过注意力机制得到隐状态加权和信息;将隐状态加权和信息输入到基于注意力加权的CNN网络,得到新闻内容特征加权和信息;将辅助信息低维矢量输入到基于注意力加权的CNN网络,得到辅助信息特征加权和信息;将新闻内容特征加权和信息和辅助信息特征加权和信息融合后输入到全连接层,得到新闻的预测虚假度。本发明专利技术的模型结合了双向GRU和CNN,通过将文本和元数据相结合来提取全局和局部特征,同时多部分部署注意机制,突出关键特征,提高了虚假新闻辨别能力。

【技术实现步骤摘要】
一种虚假新闻检测方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种虚假新闻检测方法、装置、计算机设备和存储介质。
技术介绍
现有技术中虚假新闻检测的模型主要有两类,基于内容的建模和基于社交网络的模型。基于内容的建模包括面向知识库、面向内容风格;基于社交网络的模型分为基于立场和基于传播行为的两种。多分类的真假新闻检测极具挑战性:由于新闻的文本信息通常很少,内容非常有限,仅仅基于新闻内容来对新闻真假性进行检测的方法准确率较低,数据利用率低,难以满足需求。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高虚假新闻辨别能力的虚假新闻检测方法、装置、计算机设备和存储介质。一种虚假新闻检测方法,所述方法包括:获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。在其中一个实施例中,还包括:通过词嵌入生成部分的GloVe算法或word2vec算法,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。在其中一个实施例中,还包括:将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络;通过双向GRU网络获得所述新闻内容低维矢量序列的前字特征和后字特征;所述前字特征由前向GRU计算得到,所述后字特征由后项GRU计算得到;所述前字特征为:其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示所述前字特征;fGUR表示如下GRU门控处理函数:zt=σ(Wz[ht-1,xt])rt=σ(Wr[ht-1,xt])相应的,表示GRU针对前字进行处理;所述后字特征为:其中,表示所述后字特征;表示GRU针对后字进行处理;将所述前字特征和所述后字特征并串联,得到当前时刻的隐状态为:其中,ht表示当前t时刻的隐状态;根据所有时间步骤的所述隐状态,得到全局信息矩阵;通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息。在其中一个实施例中,还包括:通过机器学习算法得到所述全局信息矩阵中每个隐状态的权重为:其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(Wtht+bt),Wt表示隐状态ht对应的权重,bt表示偏置项;计算所述隐状态和所述隐状态的权重的加权和,得到隐状态注意力向量为:其中,为所述隐状态注意力向量,L表示所述新闻内容的总字数;将所述隐状态注意力向量作为所述隐状态加权和信息。在其中一个实施例中,还包括:将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图;所述新闻内容特征映射图中的项为:yi=ReLU(Wm·Xi:i+m-1+bm)其中,yi表示所述新闻内容特征映射图中的项;Xi:i+m-1表示所述隐状态加权和信息对应的矩阵X第i行到第i+m-1行的子矩阵,m表示所述子矩阵的行数;Wm表示与Xi:i+m-1对应的权重矩阵,bm表示偏置项;ReLU表示ReLU激活函数;通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容注意力向量为:其中,为所述新闻内容注意力向量,αi′表示yi对应的权重,且∑αi′=1;将所述新闻内容注意力向量作为新闻内容特征加权和信息。在其中一个实施例中,还包括:获取辅助信息;将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量对应的矩阵V;将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波,得到辅助信息特征映射图;所述辅助信息特征映射图中的项为:zj=ReLU(Wn·Xj:j+n-1+bn)其中,zj表示所述辅助信息特征映射图中的项;Xj:j+n-1表示所述隐状态加权和信息对应的矩阵V第j行到第j+n-1行的子矩阵,n表示所述子矩阵的行数;Wn表示与Xj:j+n-1对应的权重矩阵,bn表示偏置项;通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息注意力向量为:其中,为所述辅助信息注意力向量,αj″表示zj对应的权重,且∑αj″=1;将所述辅助信息注意力向量作为辅助信息特征加权和信息。在其中一个实施例中,还包括:将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵为:其中,U表示所述融合特征矩阵;Y表示所述新闻内容特征加权和信息;Z表示所述辅助信息特征加权和信息;将所述融合特征矩阵输入到所述全连接层进行检测,利用全连通层得到特征序列为:rk=ReLU(WkUk+bk)其中,rk表示所述特征序列;Wk为softmax权值矩阵,bk表示偏置项;根据所述特征序列通过softmax函数得到所述新闻内容的预测虚假度为:ck=softmax(rk)其中,ck表示所述预测虚假度。一种虚假新闻检测装置,所述装置包括:新闻内容获取模块,用于获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;新闻内容低本文档来自技高网...

【技术保护点】
1.一种虚假新闻检测方法,其特征在于,所述方法包括:/n获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;/n通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;/n将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;/n将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;/n获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;/n将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;/n根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。/n...

【技术特征摘要】
1.一种虚假新闻检测方法,其特征在于,所述方法包括:
获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;
通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;
将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;
将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;
获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;
将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;
根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。


2.根据权利要求1所述的方法,其特征在于,所述通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量包括:
通过词嵌入生成部分的GloVe算法或word2vec算法,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。


3.根据权利要求1所述的方法,其特征在于,将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息包括:
将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络;
通过双向GRU网络获得所述新闻内容低维矢量序列的前字特征和后字特征;所述前字特征由前向GRU计算得到,所述后字特征由后项GRU计算得到;
所述前字特征为:



其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示所述前字特征;表示GRU针对前字进行处理;
所述后字特征为:



其中,表示所述后字特征;表示GRU针对后字进行处理;
将所述前字特征和所述后字特征并串联,得到当前时刻的隐状态为:



其中,ht表示当前t时刻的隐状态;
根据所有时间步骤的所述隐状态,得到全局信息矩阵;
通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息。


4.根据权利要求3所述的方法,其特征在于,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息包括:
通过机器学习算法得到所述全局信息矩阵中每个隐状态的权重为:



其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(Wtht+bt),Wt表示隐状态ht对应的权重,bt表示偏置项;
计算所述隐状态和所述隐状态的权重的加权和,得到隐状态注意力向量为:



其中,为所述隐状态注意力向量,L表示所述新闻内容的总字数;
将所述隐状态注意力向量作为所述隐状态加权和信息。


5.根据权利要求4所述的方法,其特征在于,将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息包括:
将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图;所述新闻内容特征映射图中的项为:
yi=ReLU(Wm·Xi:i+m-1+bm)
其中,yi表示所述新闻内容特征映射图中的项;Xi:i+m-1表示所述隐状态加权和信息对应的矩阵X第i行到第i+m-1行的子矩阵,m表示所述子矩阵的行数;Wm表示与Xi:i+m-1对应的权重矩阵,bm表示偏置项;ReLU表示ReLU激活函数;

【专利技术属性】
技术研发人员:胡艳丽童谭骞谭立君左浩李川
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1