一种基于多视角协同的多领域虚假新闻检测方法技术

技术编号:38732921 阅读:11 留言:0更新日期:2023-09-08 23:21
本发明专利技术提供了一种基于多视角协同的多领域虚假新闻检测方法,旨在解决现有虚假新闻检测方法在领域转移上存在的问题,以提高模型在多领域场景中的性能表现。本方法基于多视角协同和专家网络特征提取,通过引入领域门网络学习领域和视角之间的关系,实现了对领域特征的有效利用。本发明专利技术所提供的多领域虚假新闻检测方法可以应用于社交媒体、新闻传媒、在线问答等领域,为用户提供可靠、准确的信息,具有广泛的应用前景。的应用前景。的应用前景。

【技术实现步骤摘要】
一种基于多视角协同的多领域虚假新闻检测方法


[0001]本专利技术涉及虚假新闻检测领域,具体为一种基于多视角协同的多领域虚假新闻检测方法。

技术介绍

[0002]随着互联网的普及和社交媒体的流行,虚假新闻已经成为一个严重的问题。虚假新闻不仅会误导人们的思想,而且会对社会产生严重的影响。因此,虚假新闻检测成为一个热门的研究方向。虚假新闻检测的目的是将新闻内容分为真假两类。现有的方法主要可以分为基于内容的方法和基于社交上下文的方法。
[0003]在基于内容的方法中,研究者主要通过分析新闻的文本内容,从中提取特征来检测虚假新闻。这些特征包括词汇特征、语义特征和统计特征等。一些研究者还利用外部证据,如知识图谱或事实核查网站中的信息,来进行虚假新闻检测。基于内容的方法的优点是可以独立地分析新闻文本,但缺点是可能忽略了社交上下文信息。
[0004]基于社交上下文的方法主要是通过对新闻传播过程进行建模,挖掘新闻传播的结构信号。这些方法可以通过分析社交媒体实体之间的交互来捕捉社交上下文信息。另一方面,一些研究者利用群体智慧,如情感和立场等,来检测虚假新闻。
[0005]多领域虚假新闻检测是虚假新闻检测的一个重要分支。不同领域的新闻有着不同的特征,因此需要使用不同的模型来检测虚假新闻。多领域虚假新闻检测方法旨在从不同领域的数据中学习到通用的特征,以提高虚假新闻检测的准确性和泛化性能。
[0006]基于情感的虚假新闻检测是另一种虚假新闻检测的方法。研究表明,情感特征对于虚假新闻的检测非常重要。一些研究者利用情感特征、新颖性以及情绪等多个任务来进行多任务学习,以提高虚假新闻检测的性能。
[0007]综上所述,虚假新闻检测是一个重要的研究方向,可以通过基于内容、基于社交上下文、多领域和基于情感等多种方法来进行。这些方法可以分别或结合使用来提高虚假新闻检测的准确性和泛化性能。未来,虚假新闻检测的研究将继续发展,同时也需要不断地探索新的技术和方法,以应对新的虚假新闻的挑战。

技术实现思路

[0008]本专利技术的目的是针对现有技术的缺陷,提供一种基于多视角协同的多领域虚假新闻检测方法,以解决上述
技术介绍
提出的问题。
[0009]为实现上述目的,本专利技术提供如下技术方案:一种基于多视角协同的多领域虚假新闻检测方法,按如下步骤完成判断该新闻是否为虚假新闻:
[0010]S1:接收新闻内容输入,将输入新闻内容经过BERT模型处理,获得词嵌入向量;
[0011]S2:将词嵌入向量通过双向LSTM处理,提取新闻的顺序特征;
[0012]S3:使用语义网络和领域网络分别处理新闻内容,得到新闻的语义特征和领域特定特征;
[0013]S4:通过混合专家系统处理新闻内容,获得情感特征和风格特征;
[0014]S5:将语义特征、领域特定特征、情感特征和风格特征输入跨视角融合模块实现自适应跨视图表示;
[0015]S6:根据领域网络获得的权重,对融合后的特征进行加权求和,得到总的特征表示;
[0016]S7:将总的特征表示输入分类器模块,对新闻内容进行真假性判断;
[0017]S8:输出新闻真假性判断结果。
[0018]作为本专利技术的一种优选技术方案:所述虚假新闻检测问题的建模包含以下步骤:
[0019]K1:将新闻P的文本内容使用BERT预训练模型编码为长度为T的标记序列;
[0020]K2:从新闻P中提取情感特征E和风格特征S,其中情感特征E和风格特征S都是数值特征;
[0021]K3:将新闻P的域标签g作为输入,结合情感特征E和风格特征S,使用多任务学习的方法,训练一个多领域虚假新闻检测模型;
[0022]K4:对于新闻P,输入其文本标记序列、情感特征E和风格特征S,结合其域标签g,使用训练好的多领域虚假新闻检测模型,输出其真假标签y;
[0023]K5:对于多个域标签,重复步骤K3和K4,得到每个域下的真假标签y,最终将多个域下的真假标签y结合起来,得到新闻P的最终真假标签;
[0024]K6:对于新闻P的每个域标签,使用一组混淆矩阵、准确率、召回率、F1分数等指标,评估该域下的虚假新闻检测性能。
[0025]作为本专利技术的一种优选技术方案:所述多视角协同的具体提取流程包含如下步骤:
[0026](a):设置超参数T,表示专家网络中的专家个数;
[0027](b):构建混合专家网络,包括语义网络、情感网络、风格网络和领域网络;
[0028](c):将输入新闻文本转换为词向量W;
[0029](d):对于每个专家网络执行以下操作:
[0030](d1):确定各个专家网络模型结构以及其中的可学习参数θ
i

[0031](d2):利用词向量W和可学习参数θ
i
,计算专家网络的输出表示r
i

[0032](e):根据各个专家网络的输出表示r
i
,获得输入新闻文本的多视角特征表示;
[0033]其中,每个专家网络(1≤i≤T)都有自己擅长的领域,善于提取某一领域的特征。
[0034]作为本专利技术的一种优选技术方案:所述S5中跨视角融合的具体流程步骤为:
[0035]S51:接收多个视图的输入数据,其中每个视图表示一个特定的数据特征,包括但不限于语义、情感和风格;
[0036]S52:为每个视图计算对应的权重系数,其中w
sem
,w
emo
和w
stl
分别表示语义、情感和风格视图的权重系数;
[0037]S53:计算跨视图交互表示z,通过将不同视图的权重系数与对应的视图表示相乘并求和得到,其中计算公式为:
[0038][0039]其中k
sem
,k
emo
,k
stl
分别代表语义网络,情感网络以及风格网络中的专家个数,其中lnr
sem
,lnr
emo
和lnr
stl
分别表示语义、情感和风格视图的视图表示,w
domain
和lnr
domain
代表领域权重和领域局部视图表示;
[0040]S54:设置多头跨视角融合,每个头自适应地学习一种跨视图表示,生成一组跨视图表示集合其中H代表跨视图表示的数量;
[0041]S55:根据生成的跨视图表示集合对输入数据进行分类或回归任务处理并输出结果。
[0042]作为本专利技术的一种优选技术方案:所述S7中分类器模块的具体特征为:
[0043]S71:采用不同的专家网络获取新闻文章的跨视图表示;
[0044]S71:将领域标签输入领域门,以建模领域差异,得到权重分数,权重函数表示为softmax(MLP(g));
[0045]S71:根据计算得到的权重分数聚合跨视图表示,公式为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多视角协同的多领域虚假新闻检测方法,其特征在于:其采用了多视角协同的办法结合领域信息解决多领域虚假新闻检测问题,具体包括以下步骤完成判断该新闻是否为虚假新闻:S1:接收新闻内容P,将输入新闻内容经过BERT模型处理,获得词嵌入向量;S2:将词嵌入向量通过双向LSTM处理,提取新闻的顺序特征;S3:使用语义网络和领域网络分别处理新闻内容,得到新闻的语义特征和领域特定特征;S4:通过混合专家系统处理新闻内容P,获得情感特征E和风格特征S;S5:将语义特征、领域特定特征、情感特征和风格特征输入跨视角融合模块实现自适应跨视图表示;S6:根据领域网络获得的权重,对融合后的特征进行加权求和,得到总的特征表示;S7:将总的特征表示输入分类器模块,对新闻内容进行真假性判断;S8:输出新闻真假性判断结果。2.根据权利要求1所述的一种基于多视角协同的多领域虚假新闻检测方法,其特征在于:所述解决虚假新闻检测问题中,其建模包含以下步骤:K1:将新闻内容P的文本内容使用BERT预训练模型编码为长度为T的文本标记序列;K2:从新闻内容P中提取情感特征E和风格特征S,其中情感特征E和风格特征S都是数值特征;K3:将新闻P的域标签g作为输入,结合情感特征E和风格特征S,使用多任务学习的方法,训练一个多领域虚假新闻检测模型,其中域标签g∈{Domian1,

,Somain
N
},Domian代表域的具体值;K4:对于新闻P,输入其文本标记序列、情感特征E和风格特征S,结合其域标签g,使用训练好的多领域虚假新闻检测模型,输出其真假标签y;K5:对于多个域标签,重复步骤K3和K4,得到每个域下的真假标签y,最终将多个域下的真假标签y结合起来,得到新闻P的最终真假标签;K6:对于新闻P的每个域标签g,使用一组评估指标,评估指标包括混淆矩阵、准确率、召回率以及F1分数,评估该域下的虚假新闻检测性能。3.根据权利要求1所述的一种基于多视角协同的多领域虚假新闻检测方法,其特征在于:所述多视角协同的办法:其具体提取流程包含如下步骤:(a):设置超参数T,表示专家网络中的专家个数;(b):构建混合专家网络,包括语义网络、情感网络、风格网络和领域网络;(c):将输入新闻内容P的文本内容转换为词向量W;(d):对于每个专家网络执行以下操作:(d1):确定每个专家网络的模型结构以及其中的可学习参数θ
i
;(d2):利用词向量W和可学习参数θ
i
,计算专家网络的输出表示r
i
;(e):根据各个专家网络的输出表示r
i
,获得输入新闻文本的多视角特征表示;其中,每个专家网络用于提取不同领域的特征。4.根据权利要求1所述的一种基于多视角协同的多领域虚假新闻检测方法,其特征在
于:所述S5中跨视角融合模块的具体操作流程步骤包含为:S51:接收多个视图的输入数据,其中每个视图表示一个特定的数据特征,包括但不限于语义、情感和风格;S52:为每个视图计算对应的权重系数,其中W...

【专利技术属性】
技术研发人员:李慧蒋园园王晨曦顾勇张舒仲兆满李鑫左宇航
申请(专利权)人:江苏海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1