System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多源社交数据的实时虚假新闻事件检测方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>济南大学专利>正文

基于多源社交数据的实时虚假新闻事件检测方法及系统技术方案

技术编号:40600985 阅读:7 留言:0更新日期:2024-03-12 22:05
本发明专利技术公开的基于多源社交数据的实时虚假新闻事件检测方法及系统,包括:获取与新闻事件相关联的新闻及其评论;根据各新闻与新闻事件的相关度,确定各新闻的信赖度;确定新闻评论的形容词占比特征、相似度特征、特征词语特征及情感分析特征,将形容词占比特征、相似度特征、特征词语特征和情感分析特征进行拼接,获得新闻事件的评论特征;根据各新闻的内容,确定各新闻的真假性,将各新闻的信赖度作为权重对各新闻的真假性进行加权求和,获得新闻事件的内容特征;将新闻事件的内容特征和评论特征进行拼接,获得新闻事件的拼接特征;根据新闻事件的拼接特征,确定新闻事件的真假判定结果。实现了对新闻事件的准确判断。

【技术实现步骤摘要】

本专利技术涉及虚假新闻检测,尤其涉及基于多源社交数据的实时虚假新闻事件检测方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、随着互联网和社交媒体的兴起,新闻信息的传播方式发生了巨大改变。传统媒体渠道的垄断地位被打破,每个人都可以通过社交媒体平台发布和分享信息,使得新闻信息的传播更加快速和广泛。然而,正是因为信息的快速传播和广泛分享,虚假新闻也随之出现。虚假新闻的出现破坏了信息的可信度和可靠性,使得公众很难辨别真相和谎言。这可能导致公众对新闻媒体产生不信任,甚至对整个信息生态系统的稳定性产生质疑。鉴于虚假新闻的潜在危害,对虚假新闻检测和打击的需求日益增加。

3、目前网路上充斥着大量形形色色的虚假新闻,仅依靠人工进行检测难以应对如此庞大的新闻数量。因此借助深度学习算法模型来代替人工检测成为必然趋势。当下主流的虚假新闻检测算法面临着以下问题:

4、1、现有的虚假新闻检测模型只单纯关注于新闻内容的本身,但对于其在传播过程中相关评论缺乏应有的关注。这就导致一个新闻的真假判断很大程度受限制于新闻编写者的写作技巧,这就使得算法模型在遇到“造假高手”之时,难以有较好表现。因此为提升算法模型在面对复杂情况下的准确率,对于新闻评论的关注迫在眉睫。

5、2、现有的虚假检测算法其在训练之时,其训练数据往往是不会动态更新变化的,采用以往的训练数据则会导致在对当下流行的新闻识别率下降,对于网络热词缺乏基本认识。所以,一个动态实时更新的后台训练数据是解决这一难题的必由之路。

6、3、当前的虚假新闻检测模型仅是对单个新闻的真假进行判断,不能对整个新闻事件的整体进行真假判断,缺乏对于整体的把控,使得其判断的可用性大打折扣。同时在对新闻判断时也缺乏对于新闻的分类思想,往往只是对于某一类别进行研究,不具有普适性。


技术实现思路

1、本专利技术为了解决上述问题,提出了基于多源社交数据的实时虚假新闻事件检测方法及系统,结合新闻时间中所有新闻评论和新闻的内容,实现了对新闻事件的准确判断。

2、为实现上述目的,本专利技术采用如下技术方案:

3、第一方面,提出了基于多源社交数据的实时虚假新闻事件检测方法,包括:

4、获取与新闻事件相关联的新闻及其评论;

5、根据各新闻与新闻事件的相关度,确定各新闻的信赖度;

6、确定新闻评论的形容词占比特征、相似度特征、特征词语特征及情感分析特征,将形容词占比特征、相似度特征、特征词语特征和情感分析特征进行拼接,获得新闻事件的评论特征;

7、根据各新闻的内容,确定各新闻的真假性,将各新闻的信赖度作为权重对各新闻的真假性进行加权求和,获得新闻事件的内容特征;

8、将新闻事件的内容特征和评论特征进行拼接,获得新闻事件的拼接特征;

9、根据新闻事件的拼接特征,确定新闻事件的真假判定结果。

10、第二方面,提出了基于多源社交数据的实时虚假新闻事件检测系统,包括:

11、数据集获取模块,用于获取与新闻事件相关联的新闻及其评论;

12、信赖度获取模块,用于根据各新闻与新闻事件的相关度,确定各新闻的信赖度;

13、评论特征获取模块,用于确定新闻评论的形容词占比特征、相似度特征、特征词语特征及情感分析特征,将形容词占比特征、相似度特征、特征词语特征和情感分析特征进行拼接,获得新闻事件的评论特征;

14、内容特征获取模块,用于根据各新闻的内容,确定各新闻的真假性,将各新闻的信赖度作为权重对各新闻的真假性进行加权求和,获得新闻事件的内容特征;

15、特征拼接模块,用于将新闻事件的内容特征和评论特征进行拼接,获得新闻事件的拼接特征;

16、新闻事件真假判定模块,用于根据新闻事件的拼接特征,确定新闻事件的真假判定结果。

17、第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成基于多源社交数据的实时虚假新闻事件检测方法所述的步骤。

18、第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成基于多源社交数据的实时虚假新闻事件检测方法所述的步骤。

19、与现有技术相比,本专利技术的有益效果为:

20、1、相比于目前当下流行的虚假新闻检测技术,其只重点关注于新闻内容的本身的内容,缺乏对于新闻在传播过程中产生评论的关注,导致虚假新闻检测技术受限于新闻编写者以及算法开发者的知识储备量,面对一些特殊的新闻无法做到准确识别。本专利技术是把新闻评论和内容相结合来进行综合分析,极大的提升了算法的稳定性,提高了新闻事件真假判断的准确性。

21、2、现有的虚假新闻检测技术通常只能从单一数据来源获取新闻,无法有效整合来自不同网站或渠道的新闻报道,且不能实现数据的动态更新扩充,这导致对当下新兴的事件,现有的算法因为没有更新最近的相关新闻信息,因此在判断上会有失偏颇。本专利技术在每一次实际访问请求时都会利用网络爬虫技术从多个大型新闻网站扩充原始新闻数据,以最新的相关数据进行判断依据,在判断之后会对原始新闻数据集进行动态更新,从而实现实时的虚假新闻事件检测。

22、3、本专利技术在根据新闻内容,确定新闻的真假性时,首选判断了新闻事件所属类别,通过新闻事件所属类别对应的训练好的新闻真假判断模型,对新闻内容进行识别,确定了新闻的真假性,使得新闻的真假判断更有针对性,保证根据新闻内容进行新闻真假性判断的准确性,进而保证了提取的新闻的内容特征的准确性,从而保证了新闻事件真假识别的准确性。

23、本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。

本文档来自技高网...

【技术保护点】

1.基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,包括:

2.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,获取新闻事件的事件描述,及各新闻的主题词向量;计算各新闻的主题词向量与事件描述的相似度,获得各新闻与新闻事件的相关度;对各新闻与新闻事件的相关度进行归一化,获得各新闻的信赖度。

3.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,确定新闻事件中所有新闻评论的所有词语的个数和形容词的个数;将形容词的个数除以所有词语的个数,获得新闻评论的形容词占比特征;

4.如权利要求3所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,积极评论个数c、消极评论个数d、积极内容个数a及消极内容个数b,确定新闻评论的情感分析特征emo-socre:

5.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,确定新闻事件类别,选取新闻事件所属类别对应的训练好的新闻真假判断模型,对新闻的内容进行识别,获得新闻的真假性。

6.如权利要求5所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,获取原始新闻数据集;

7.如权利要求6所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,获取的新闻及其评论,加入至原始新闻数据集中,对原始新闻数据集进行更新。

8.基于多源社交数据的实时虚假新闻事件检测系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的基于多源社交数据的实时虚假新闻事件检测方法的步骤。

10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的基于多源社交数据的实时虚假新闻事件检测方法的步骤。

...

【技术特征摘要】

1.基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,包括:

2.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,获取新闻事件的事件描述,及各新闻的主题词向量;计算各新闻的主题词向量与事件描述的相似度,获得各新闻与新闻事件的相关度;对各新闻与新闻事件的相关度进行归一化,获得各新闻的信赖度。

3.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,确定新闻事件中所有新闻评论的所有词语的个数和形容词的个数;将形容词的个数除以所有词语的个数,获得新闻评论的形容词占比特征;

4.如权利要求3所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,积极评论个数c、消极评论个数d、积极内容个数a及消极内容个数b,确定新闻评论的情感分析特征emo-socre:

5.如权利要求1所述的基于多源社交数据的实时虚假新闻事件检测方法,其特征在于,确定新闻事件类...

【专利技术属性】
技术研发人员:纪科高源马坤杨波陈贞翔孙润元
申请(专利权)人:济南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1