基于新闻环境信息建模的虚假新闻检测方法技术

技术编号:34384290 阅读:34 留言:0更新日期:2022-08-03 21:04
本发明专利技术涉及一种基于新闻环境信息建模的虚假新闻检测方法,其特征在于:基于待检测新闻获取其发布前若干天内的新闻消息集合,将其作为宏观新闻环境;从新闻消息集合中提取与待检测新闻相似度最高的若干条新闻,将其作为微观新闻环境;基于待检测新闻向量与宏观新闻环境所有新闻元素向量的相似度计算宏观环境感知向量;基于待检测新闻向量和微观环境中心向量与微观新闻环境所有新闻元素向量的相似度计算微观环境感知向量,其中微观环境中心向量为微观新闻环境所有新闻元素向量的均值;获取虚假新闻检测器的对待检测新闻的新闻表示向量,将新闻表示向量与所述宏观环境感知向量和所述微观环境感知向量融合,并基于融合结合判断该待检测新闻的真假。断该待检测新闻的真假。断该待检测新闻的真假。

【技术实现步骤摘要】
基于新闻环境信息建模的虚假新闻检测方法


[0001]本专利技术涉及一种基于新闻环境信息建模的虚假新闻检测方法。适用于社交 媒体数据挖掘和互联网内容安全领域。

技术介绍

[0002]社交媒体上的虚假新闻问题已经在政治、经济、民生等方面对现实世界构 成了威胁。为了实现对虚假新闻的高效检测,已有许多研究着眼于开发自动虚 假新闻检测系统。按照关注点不同,国内外自动检测虚假新闻内容的方法大致 可分为两种:
[0003]第一类是仅仅基于消息内容的检测方法,这类方法关注于虚假新闻本身是
ꢀ“
如何写”的,即不同虚假新闻之间共享的模式信息(如风格、情感、语言运 用偏好等)。例如利用了虚假新闻中的情感、态度、情绪等信息。
[0004]第二类是基于事实证据的方法,这类方法主要通过检索外部证据库以判断 给定新闻中描述的事件是否为真,并根据这些证据本身的可信度和其对给定新 闻的支持、反对或中立立场,判断给定新闻所描述事件的真实性。例如引入了 维基百科作为外部证据库,直接使用搜索引擎得到相关证据,针对“旧谣新传
>”ꢀ
现象本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于新闻环境信息建模的虚假新闻检测方法,其特征在于:基于待检测新闻获取其发布前若干天内的新闻消息集合,将该新闻消息集合作为宏观新闻环境;从新闻消息集合中提取与待检测新闻相似度最高的若干条新闻,将该若干条新闻作为微观新闻环境;基于待检测新闻向量与宏观新闻环境所有新闻元素向量的相似度计算宏观环境感知向量;基于待检测新闻向量和微观环境中心向量与微观新闻环境所有新闻元素向量的相似度计算微观环境感知向量,其中微观环境中心向量为微观新闻环境所有新闻元素向量的均值;获取虚假新闻检测器的对待检测新闻的新闻表示向量,将新闻表示向量与所述宏观环境感知向量和所述微观环境感知向量融合,并基于融合结合判断该待检测新闻的真假。2.根据权利要求1所述的基于新闻环境信息建模的虚假新闻检测方法,其特征在于,所述基于待检测新闻向量与宏观新闻环境所有新闻元素向量的相似度计算宏观环境感知向量,包括:使用C个高斯核对各个相似度数值按不同区间进行池化;将所有C个高斯核的输出拼接,得到宏观环境核池化向量;将宏观环境核池化向量、待检测新闻向量及宏观环境中心向量拼接后送入多层感知机网络,得到宏观环境感知向量;所述宏观环境中心向量为宏观新闻环境所有新闻元素向量的均值。3.根据权利要求2所述的基于新闻环境信息建模的虚假新闻检测方法,其特征在于,所述使用C个高斯核对各个相似度数值按不同区间进行池化,包括:第j个高斯核的输出为其中,μ
j
和σ
j
分别是第j个高斯核的中心和宽度。4.根据权利要求1所述的基于新闻环境信息建模的虚假新闻检测方法,其特征在于,所述基于待检测新闻向量和微观环境中心向量与微观新闻环境所有新闻元素向量的相似度计算微观环境感知向量,包括:使用C个高斯核对各个相似度数值按不同区间进行池化;将所有C个高斯核的输出拼接,分别得到新闻

微观环境核池化向量和中心

微观环境核池化向量;使用多层感知机网络计算待检测新闻向量和微观环境中心向量的语义交互向量;使用多层感知机网络计算新闻

微观环境核池化向量和中心

微观环境核池化向量的相似度交互向量;将语义交互向量和相似度交互向量拼接后送入多层感知机网络,得到微观环境感知向量。
5.根据权利要求4所述的基于新闻环境信息建模的虚假新闻检测方法,其特征在于,所述使用多层感知机网络计算新闻

微观环境核池化向量和中心

微观环境核池化向量的相似度交互向量,包括:u
sim
=MLP3(g(K(p,ε
mic
),K(m(ε

【专利技术属性】
技术研发人员:曹娟盛强张雪遥李润东汪旦丁朱勇椿谢添
申请(专利权)人:北京中科睿鉴科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1