虚假新闻检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38323509 阅读:11 留言:0更新日期:2023-07-29 09:05
本发明专利技术公开了一种虚假新闻检测方法、装置、计算机设备及存储介质,所述虚假新闻检测方法包括:从社交网络平台中采集待检测新闻的新闻信息,并对所采集的新闻信息进行预处理;其中,所述新闻信息包括新闻内容和对应的评论;使用情感词典对评论的情绪值进行评分计算,且根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据;利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,其中,所述虚假新闻检测模型是通过对历史新闻的新闻信息和实际真假信息对预训练的深度学习网络训练得到的。络训练得到的。络训练得到的。

【技术实现步骤摘要】
虚假新闻检测方法、装置、计算机设备及存储介质


[0001]本专利技术涉及信息处理
,更具体地涉及一种虚假新闻检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]近年来,移动互联网已经成为我们日常生活中不可或缺的一部分。最近的调查显示,全球互联网用户数量为49亿,而社交媒体用户数量突破45亿,随着社交媒体的发展,越来越多的人可以通过网络平台浏览各种新闻、发布消息、或分享观点等,这使得信息的传递变得简单快捷。然而,社交媒体在给我们带来各种便利的同时,也引发了不少社会问题,例如越来越多虚假新闻被发布,人们难以辨别新闻的真实性,且在各类重大突发公共事件中,虚假新闻的传播具有不可低估的社会影响力。

技术实现思路

[0003]本专利技术实施例提供了一种虚假新闻检测方法、装置、计算机设备及存储介质,以实现对虚假新闻的检测,且检测准确率较高。
[0004]第一方面,本专利技术实施例提供了一种虚假新闻检测方法,其包括:
[0005]从社交网络平台中采集待检测新闻的新闻信息,并对所采集的新闻信息进行预处理;其中,所述新闻信息包括新闻内容和对应的评论;
[0006]使用情感词典对评论的情绪值进行评分计算,且根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据;
[0007]利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,其中,所述虚假新闻检测模型是通过对历史新闻的新闻信息和实际真假信息对预训练的深度学习网络训练得到的。
[0008]第二方面,本专利技术实施例还提供了一种虚假新闻检测装置,其包括
[0009]采集处理单元,用于从社交网络平台中采集待检测新闻的新闻信息,并对所采集的新闻信息进行预处理;其中,所述新闻信息包括新闻内容和对应的评论;
[0010]情感分析单元,用于使用情感词典对评论的情绪值进行评分计算;
[0011]排序拼接单元,用于根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据;
[0012]虚假新闻检测单元,包括有虚假新闻检测模型,用于对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,其中,所述虚假新闻检测模型是通过对历史新闻的新闻信息和实际真假信息对预训练的深度学习网络训练得到的。
[0013]第三方面,本专利技术实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
[0014]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上
述方法。
[0015]与现有技术相比,本专利技术使用情感词典对从社交网络平台采集的待检测新闻的评论的情绪值进行评分计算,然后根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据,且利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,可知,本专利技术可以对虚假新闻进行检测,以避免虚假新闻带来的社会风险,且优先选用情绪值评分较高的评论拼接在新闻内容后,使得即使输入检测数据的序列长度超过虚假新闻检测模型限定的序列长度上限时,可以尽量把包含有比较重要信息的情绪值比较高的评论保留下来,不会被截断,可进一步提高虚假新闻的检测准确率。
附图说明
[0016]图1是本专利技术实施例提供的虚假新闻检测方法的流程示意图。
[0017]图2是本专利技术实施例提供的虚假新闻检测装置的示意性框图。
[0018]图3是本专利技术虚假新闻检测单元中虚假新闻检测模型的示意性框图。
[0019]图4是本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0020]为使本领域的普通技术人员更加清楚地理解本专利技术的目的、技术方案和优点,以下结合附图和实施例对本专利技术做进一步的阐述。
[0021]参照图1,图1为本专利技术实施例提供的虚假新闻检测方法的流程示意图。如图所示,所述虚假新闻检测方法包括:
[0022]S101、从社交网络平台中采集待检测新闻的新闻信息,并对所采集的新闻信息进行预处理。
[0023]本专利技术中,所述社交网络平台包括微博、贴吧、新闻、论坛、Twitter以及数字报等,本实施例中,可采集在预设时间段内发布在预设社交网络平台的新闻信息,其中,所述新闻信息包括新闻内容和对应的评论。
[0024]具体地,所述对所采集的新闻信息进行预处理具体包括:删除所采集的新闻信息的新闻内容和对应的评论中不必要的空格和换行符;和/或,删除所采集的新闻信息的新闻内容和对应的评论中的@+用户名、表情符和邮箱;和/或,取消所采集的新闻信息的新闻内容和对应的评论中的转义HTML标记;和/或,用URL替换所采集的新闻信息的新闻内容和对应的评论中提到的超链接;和/或,将所采集的新闻信息的新闻内容和对应的评论中的繁体字转换为简体字。
[0025]S102、使用情感词典对评论的情绪值进行评分计算,且根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据。
[0026]本专利技术中,所述情感词典包括中文情感词典和英文情感词典。
[0027]情感评论不仅含有丰富的情绪,往往也含有很多重要信息,因训练模型的输入序列长度有上限,若输入检测数据的长度超过上限,则超过部分会被截断,本专利技术为了避免评论中顺序靠后的包含有重要信息的评论被截断,使用情感词典对评论的情绪值进行评分计
算,在新闻内容后按情绪值评分大小降序拼接,直到超过输入长度的限制,即优选选择情绪值的评分比较高的评论拼接在新闻内容后,这样可以尽量把重要的评论保留下来。
[0028]优选地,该步骤中,所述使用情感词典对评论的情绪值进行评分计算具体包括:对评论进行分句、分词,以获得待检测词句,且使用情感词典对待检测词句进行情感词匹配,记录匹配到的情感词分值,并汇总情感词分值进行评分计算,以获得情绪值评分。
[0029]S103、利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果。
[0030]本专利技术中,所述虚假新闻检测模型是通过对历史新闻的新闻信息和实际真假信息对预训练的深度学习网络训练得到的。该历史新闻可以是Weibo16and Weibo20等中文微博社交平台虚假信息文本数据集中,或Twitter15andTwitter16等英文推特平台虚假新闻数据集中的数据。其中,Weibo16中包含了2016年之前在新浪微博上发布的4664条中文帖子,并附有用户简介和评论,Weibo20中包含了2016

2020年新浪微博上发布的6068条中文帖子及其评论。
[0031]进一步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚假新闻检测方法,其特征在于,包括:从社交网络平台中采集待检测新闻的新闻信息,并对所采集的新闻信息进行预处理;其中,所述新闻信息包括新闻内容和对应的评论;使用情感词典对评论的情绪值进行评分计算,且根据情绪值评分的大小对评论进行降序排序,并将降序排序后的评论按序拼接于对应的新闻内容后以形成输入检测数据;利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,其中,所述虚假新闻检测模型是通过对历史新闻的新闻信息和实际真假信息对预训练的深度学习网络训练得到的。2.如权利要求1所述的虚假新闻检测方法,其特征在于,所述利用虚假新闻检测模型对待检测新闻的输入检测数据进行分析预测,以获得待检测新闻的真假预测结果,具体包括:将待检测新闻的输入检测数据分别输入虚假新闻检测模型中的RoBERT

large、XLNet、ELECTRA、AlBERT和TinyBERT基分类器内,以分别输出相应的预测标签和预测标签对应的概率值,输出的预测标签和概率值分别经虚假新闻检测模型中的软投票集成模块后输出真假预测结果。3.如权利要求1所述的虚假新闻检测方法,其特征在于,所述使用情感词典对评论的情绪值进行评分计算,具体包括:对评论进行分句、分词,以获得待检测词句,且使用情感词典对待检测词句进行情感词匹配,记录匹配到的情感词分值,并汇总情感词分值进行评分计算,以获得情绪值评分。4.如权利要求1所述的虚假新闻检测方法,其特征在于,所述对所采集的新闻信息进行预处理,具体包括:删除所采集的新闻信息中不必要的空格和换行符;和/或,删除所采集的新闻信息中的@+用户名、表情符和邮箱;和/或,取消所采集的新闻信息中的转义HTML标记;和/或,用URL替换所采集的新闻信息中提到的超链接;和/或,将所采集的新闻信息中的繁体字转换为简...

【专利技术属性】
技术研发人员:韩益亮崔骕
申请(专利权)人:中国人民武装警察部队工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1