一种跨平台虚假新闻检测方法及系统技术方案

技术编号:33630652 阅读:24 留言:0更新日期:2022-06-02 01:33
本发明专利技术涉及机器学习技术领域,公开了一种跨平台虚假新闻检测方法及系统。所述方法包括:获取待检测新闻,全网搜索该条新闻的推文,对于每条推文,均提取其评论信息;对这些评论信息,分别分析情感分布特征和发布时间分布特征;对所述新闻的标题和正文内容进行一致性分析,得到文本一致性特征;根据所述新闻发布时间和推文发布时间,获取设定时间范围内的传播次数,得到传播特征;根据所述评论情感分布特征、评论时间分布特征、文本一致性特征和传播特征,得到所述新闻的虚假程度评测结果。本发明专利技术基于情感、时间、文本和传播特征,实现了对虚假新闻的检测。假新闻的检测。假新闻的检测。

【技术实现步骤摘要】
一种跨平台虚假新闻检测方法及系统


[0001]本专利技术属于机器学习
,尤其涉及一种跨平台虚假新闻检测方法及系统。

技术介绍

[0002]近年来,随着移动互联网的快速发展,网络已成为虚假信息传播的主要渠道。类似于微博、推特等几乎人手一个账号的社交媒体在对新闻的传播起了很大的作用。虚假信息在一个平台中发源、传播到其他平台,即使源平台的虚假被遏制,也会因为其他平台的回溯效果再次传导回源平台,造成此消彼长的潮汐现象。
[0003]近年来,对虚假新闻检测的研究主要集中于新闻的各个特征,包括用户分析数据、文本内容和新闻传播方式。有些研究基于用户的特征和时间特征进行分析,有些研究人员利用文章的语言特征对新闻的真伪性进行判断,如写作风格,词汇和语法分析等。然而,这些利于特征提取的方法不仅耗时耗力,而且还不能充分利用新闻所包含的信息。

技术实现思路

[0004]为克服上述现有技术的不足,本专利技术提供了一种跨平台虚假新闻检测方法,基于情感、时间、文本和传播特征,实现了对虚假新闻的检测。
[0005]为实现上述目的,本专利技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种跨平台虚假新闻检测方法,其特征在于,包括以下步骤:获取待检测新闻,全网搜索该条新闻的推文,对于每条推文,均提取其评论信息;对这些评论信息,分别分析情感分布特征和发布时间分布特征;对所述新闻的标题和正文内容进行一致性分析,得到文本一致性特征;根据所述新闻发布时间和推文发布时间,获取设定时间范围内的传播次数,得到传播特征;根据所述评论情感分布特征、评论时间分布特征、文本一致性特征和传播特征,得到所述新闻的虚假程度评测结果。2.如权利要求1所述的虚假新闻检测方法,其特征在于,分析情感分布特征包括:对每条评论信息依次进行情感分析,得到每条评论的情感值,所述情感值为

1,0或1;根据这些评论信息的情感值,采用情感值为0的评论占比用来衡量两极分化程度,作为情感分布特征。3.如权利要求2所述的虚假新闻检测方法,其特征在于,所述情感分析包括:将待分析评论信息输入词嵌入模型,获取所述评论各个词语对应的特征向量,拼接得到所述评论的特征向量;将所述特征向量输入预训练好的情感分析模型中,得到每个评论的情感预测值,其中,所述情感分析模型采用Transformer模型训练得到。4.如权利要求1所述的虚假新闻检测方法,其特征在于,分析发布时间分布特征包括:对每条评论信息的发布时间进行时间戳提取,并进行排序;将相邻时间戳之间的差值进行累加,累加值作为发布时间分布特征。5.如权利要求1所述的虚假新闻检测方法,其特征在于,对所述新闻的标题和正文内容进行一致性分析包括:对所述新闻的标题和正文内容,分别进行词嵌入,得到文本特征向...

【专利技术属性】
技术研发人员:敬静吴泓辰孙杰房晓畅张化祥
申请(专利权)人:山东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1