System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于历史新闻评论辅助的虚假新闻即时检测方法及装置制造方法及图纸_技高网

基于历史新闻评论辅助的虚假新闻即时检测方法及装置制造方法及图纸

技术编号:39956389 阅读:6 留言:0更新日期:2024-01-08 23:42
本发明专利技术提出一种基于历史新闻评论辅助的虚假新闻即时检测方法和装置,采取教师‑学生结构训练,通过训练教师网络从历史新闻评论中获取知识,通过训练学生网络将评论中的知识迁移至学生网络参数中,实现不依赖评论的检测,同时利用历史新闻和评论训练教师网络,训练好的教师网络参数被冻结不再参与接下来的训练过程;仅利用历史新闻训练学生网络并利用步骤1中训练好的教师网络加以指导,最终使用训练好的学生网络检测新发布的虚假新闻。兼顾了虚假新闻检测的即时性与准确性。

【技术实现步骤摘要】

该专利技术创造属于计算机应用和文本语义识别分类,并特别涉及一种历史新闻评论辅助的虚假新闻即时检测方法及装置。


技术介绍

1、社交媒体上的虚假新闻主要包括新闻内容和其引发的社交上下文信息(例如评论)。根据所利用信息的差异,现有的虚假新闻检测方法可以被分类为:基于内容的方法;和基于社交上下文的方法。基于内容的方法核心是通过挖掘新闻内容中具有真假可区分性的特征,早期的工作基于数据统计和分析设计手工特征以判断新闻的真实性,例如特殊词词频、文本长度、词性等,后续一些工作借助神经网络自动学习特征表示以实现对新闻的真假分类。基于社交上下文的方法在新闻内容的基础上借助评论、传播结构等信息的辅助作用,提高对虚假新闻的检测能力,其中包括以树状结构或时序结构对传播路径上的新闻和评论建模,以及通过新闻内容与评论的信息交互增强语义理解的方法。以上两类方法中,基于内容的方法由于仅仅利用内容本身而具有较高的检测即时性,但由于缺少社交上下文信息的辅助作用,准确性不高;而基于社交上下文的方法相对于前者具有更高的准确性,但由于所依赖的社交上下文信息需要时间积累,检测不够即时。

2、现有方法中,基于内容的方法可即时检测新发布的虚假新闻,但由于所利用信息的不足,其必须等待一段时间才能得到数量足够的评论信息,故其检测准确性不高;基于社交上下文的方法得益于更加丰富的信息而具有更高的准确性,但由于评论等社交上下文信息需要时间积累,这类方法无法进行即时检测。由此可见,现有方法面临着即时性与准确性无法兼顾的问题,导致无法及时有效地检测新发布的虚假新闻以及无法及时对其采取有效干预措施。


技术实现思路

1、本专利技术的目的是解决上述现有技术的虚假新闻检测即时性与准确性无法兼顾的问题,提出了一种借助历史新闻评论的虚假新闻即时检测方法。

2、具体来说,本专利技术一种基于历史新闻评论辅助的虚假新闻即时检测方法,其中包括:

3、步骤1、获取具有新闻内容及其对应评论的历史新闻作为训练样本,分别构建包括编码器和分类器的教师网络和学生网络;

4、步骤2、该教师网络的编码器分别为该训练样本的新闻内容和评论进行编码,并分别赋予内容教师关注度权重至各编码结果,得到教师内容语义特征和评论语义特征;通过情感提取器得到该训练样本中评论的情感特征;将该教师内容语义特征、该评论语义特征和该情感特征融合,得到教师融合特征,并送入该教师网络的分类器,得到教师预测结果,根据该教师预测结果和该训练样本的真伪类别标签,构建损失函数训练该教师网络;

5、步骤3、该学生网络的编码器仅为该训练样本的新闻内容进行编码,得到学生内容编码,赋予内容学生关注度权重至该学生内容编码,得到学生内容语义特征;通过社交情感预测器提取该学生内容编码的情感特征,得到虚拟社交情感特征;将该虚拟社交情感特征和该学生内容语义特征融合,得到学生融合特征,送入该学生网络的分类器,得到学生预测结果,根据该学生预测结果和该真伪类别标签,得到分类损失;根据训练完成后教师网络的教师关注度权重和该内容学生关注度权重,得到关注度损失;根据该情感特征和该虚拟社交情感特征,得到情感损失;根据该教师融合特征和该学生融合特征,得到融合损失;将该注度损失、该情感损失和该融合损失加权融合后与该分类损失相加,得到最终损失,以训练该学生网络;

6、步骤4、将待虚假检测的新闻内容输入该学生网络,得到其是否属于真假新闻的分类结果。

7、所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其中该步骤2包括:

8、通过该教师网络的编码器分别对新闻内容p和评论c进行分词和编码,得到训练样本p的编码特征p=[p1,p2,…,pm]∈rd×m,m为新闻内容分词后的词元数量,对评论c,首先按照时间顺序拼接得到进行分词和编码得到c=[c1,c2,...,cn]∈rd×n,n为所有评论分词后的词元数量;通过下式构建内容教师关注度权重f∈rm×n:

9、

10、其中,wl∈rd×d是可学习的权重矩阵,d是编码维度;基于该内容教师关注度权重,计算新闻内容和评论中基于不同词元的注意力权重分布和

11、hp=tanh(wpp+(wcc)f)

12、

13、

14、

15、其中,wp,wc∈rk×d,为权重参数,k为互注意力机制的隐层编码维度,分别为新闻内容和用户评论中不同词元的权重值构成的注意力向量。利用和对新闻内容和用户评论中的不同词元的编码特征加权可得到二者最终的语义特征

16、

17、

18、利用包含情感分析工具的情感提取器,对评论进行情感分析获取其离散情感特征并利用多层感知机对该离散情感特征进行连续化处理:

19、

20、其中连续特征et∈rd和语义特征和维度相同;和et融合得到用于该教师网络分类的整体特征ft∈rd:

21、

22、其中是可学习的参数。ft经过多层感知机得到教师网络的预测结果:

23、

24、其中为该真伪类别标签,教师网络的优化通过最小化交叉熵损失函数实现:

25、

26、其中θtea为教师网络的参数,y为新闻真实性标签的实际值。

27、所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其中该步骤3包括:

28、该学生网络的编码器对新闻内容进行分词和编码得到p1,p2,…,pm,m为新闻内容中词元的数量,并将掩码注意力机制应用于新闻内容,对不同词元分配可学习的内容学生关注度权重,得到权重向量

29、

30、利用该权重向量对新闻内容的不同词元的编码特征加权得到学生内容语义特征

31、

32、该学生网络通过社交情感预测器以新闻内容为输入预测其可能引发的虚拟社交情感特征es∈rd:

33、es=emopredictor(p1,p2,…,pm)

34、学生网络用于最终分类的特征通过加权融合和es获得:

35、

36、和为可学习的权重;

37、分类任务通过交叉熵构建该分类损失优化学生网络的参数θstu:

38、

39、

40、其中y为该真伪类别标签,为学生预测结果;

41、利用关注度损失引导学生网络中分布在新闻内容上的该内容学生关注度权重向教师网络中教师关注度权重学习:

42、

43、利用情感损失引导学生网络中预测得到的该虚拟社交情感特征es向教师网络中来自评论的该情感特征et学习:

44、

45、利用融合损失引导学生网络的该学生融合特征fs向教师网络的该教师融合特征ft学习:

46、

47、通过利用知识偏好打分器,根据新闻内容计算得到该注度损失、该情感损失和该融合损失三者对应的权重值,实现对三个方面知识的自适应加权:

48本文档来自技高网...

【技术保护点】

1.一种基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,包括:

2.如权利要求1所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该步骤2包括:

3.如权利要求1所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该步骤3包括:

4.如权利要求3所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该社交情感预测器由掩码注意力机制层和多层感知机构成。

5.一种基于历史新闻评论辅助的虚假新闻即时检测装置,其特征在于,包括:

6.如权利要求5所述的基于历史新闻评论辅助的虚假新闻即时检测装置,其特征在于,该教师训练模块用于:

7.如权利要求6所述的基于历史新闻评论辅助的虚假新闻即时检测装置,其特征在于,该学生训练模块用于:

8.如权利要求7所述的基于历史新闻评论辅助的虚假新闻即时检测装置,其特征在于,该社交情感预测器由掩码注意力机制层和多层感知机构成。

9.一种服务器,其特征在于,包括权利要求5-8所述的一种基于历史新闻评论辅助的虚假新闻即时检测装置。</p>

10.一种存储介质,用于存储一种执行权利要求1-4所述基于历史新闻评论辅助的虚假新闻即时检测方法的计算机程序。

...

【技术特征摘要】

1.一种基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,包括:

2.如权利要求1所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该步骤2包括:

3.如权利要求1所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该步骤3包括:

4.如权利要求3所述的基于历史新闻评论辅助的虚假新闻即时检测方法,其特征在于,该社交情感预测器由掩码注意力机制层和多层感知机构成。

5.一种基于历史新闻评论辅助的虚假新闻即时检测装置,其特征在于,包括:

6.如权利要求5所述的基于历史新闻...

【专利技术属性】
技术研发人员:曹娟南琼盛强汪旦丁唐胜
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1