【技术实现步骤摘要】
一种虚假新闻检测方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种虚假新闻检测方法、装置、计算机设备和存储介质。
技术介绍
现有技术中虚假新闻检测的模型主要有两类,基于内容的建模和基于社交网络的模型。基于内容的建模包括面向知识库、面向内容风格;基于社交网络的模型分为基于立场和基于传播行为的两种。多分类的真假新闻检测极具挑战性:由于新闻的文本信息通常很少,内容非常有限,仅仅基于新闻内容来对新闻真假性进行检测的方法准确率较低,数据利用率低,难以满足需求。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高虚假新闻辨别能力的虚假新闻检测方法、装置、计算机设备和存储介质。一种虚假新闻检测方法,所述方法包括:获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻 ...
【技术保护点】
1.一种虚假新闻检测方法,其特征在于,所述方法包括:/n获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;/n通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;/n将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;/n将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;/n获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项 ...
【技术特征摘要】 【专利技术属性】
1.一种虚假新闻检测方法,其特征在于,所述方法包括:
获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向GRU网络、基于注意力加权的CNN网络,以及全连接层;
通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;
将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;
将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;
获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;
将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;
根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。
2.根据权利要求1所述的方法,其特征在于,所述通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量包括:
通过词嵌入生成部分的GloVe算法或word2vec算法,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。
3.根据权利要求1所述的方法,其特征在于,将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络,通过双向GRU网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息包括:
将所述新闻内容低维矢量输入到所述基于注意力加权的双向GRU网络;
通过双向GRU网络获得所述新闻内容低维矢量序列的前字特征和后字特征;所述前字特征由前向GRU计算得到,所述后字特征由后项GRU计算得到;
所述前字特征为:
其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示所述前字特征;表示GRU针对前字进行处理;
所述后字特征为:
其中,表示所述后字特征;表示GRU针对后字进行处理;
将所述前字特征和所述后字特征并串联,得到当前时刻的隐状态为:
其中,ht表示当前t时刻的隐状态;
根据所有时间步骤的所述隐状态,得到全局信息矩阵;
通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息。
4.根据权利要求3所述的方法,其特征在于,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息包括:
通过机器学习算法得到所述全局信息矩阵中每个隐状态的权重为:
其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(Wtht+bt),Wt表示隐状态ht对应的权重,bt表示偏置项;
计算所述隐状态和所述隐状态的权重的加权和,得到隐状态注意力向量为:
其中,为所述隐状态注意力向量,L表示所述新闻内容的总字数;
将所述隐状态注意力向量作为所述隐状态加权和信息。
5.根据权利要求4所述的方法,其特征在于,将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息包括:
将所述隐状态加权和信息输入到所述基于注意力加权的CNN网络,通过所述CNN网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图;所述新闻内容特征映射图中的项为:
yi=ReLU(Wm·Xi:i+m-1+bm)
其中,yi表示所述新闻内容特征映射图中的项;Xi:i+m-1表示所述隐状态加权和信息对应的矩阵X第i行到第i+m-1行的子矩阵,m表示所述子矩阵的行数;Wm表示与Xi:i+m-1对应的权重矩阵,bm表示偏置项;ReLU表示ReLU激活函数;
技术研发人员:胡艳丽,童谭骞,谭立君,左浩,李川,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。