虚假新闻检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37245244 阅读:19 留言:0更新日期:2023-04-20 23:25
本发明专利技术提供一种虚假新闻检测方法、装置、电子设备及存储介质,该方法包括:基于新闻数据对应的文本特征从新闻数据中获取事件,判断新闻数据为第一类型新闻或者第二类型新闻;新闻数据为第一类型新闻时,基于第一事件判别器检索与新闻数据对应的历史事件判断新闻数据是否为虚假新闻;新闻数据为第二类型新闻时,基于第二事件判别器判断新闻数据是否为虚假新闻;第二事件判别器包括虚假事件检测器和事件特征提取器;虚假事件检测器用于对文本特征进行识别,得到对应事件是虚假时间的概率;事件特征提取器用于基于概率对新闻数据进行分类,确定新闻数据是否为虚假新闻。本发明专利技术可以解决现有技术中无法快速高效地识别虚假新闻的技术问题。的技术问题。的技术问题。

【技术实现步骤摘要】
虚假新闻检测方法、装置、电子设备及存储介质


[0001]本专利技术涉及网络信息传播
,具体涉及一种虚假新闻检测方法、装置、电子设备及存储介质。

技术介绍

[0002]社交网络服务的普及导致其用户群体迅速扩增,与此同时,带来了信息量的极速增长。社交网络在线平台允许其用户在其平台上自由地发布信息。这些庞大的用户群体每日发布海量的信息,但是其中也充斥着许多不实的或者说是虚假的信息。虚假的信息可以利用社交网络这个平台快速传播,因此,如何快速高效地识别虚假新闻,是一项具有非常重大意义的课题。

技术实现思路

[0003]有鉴于此,有必要提供一种虚假新闻检测方法、装置、电子设备及存储介质,用以解决现有技术中无法快速高效地识别虚假新闻的技术问题。
[0004]为了实现上述目的,本专利技术提供了一种虚假新闻检测方法,包括:
[0005]获取待测的新闻数据,对所述新闻数据进行特征提取,得到对应的文本特征;
[0006]基于所述文本特征从所述新闻数据中获取事件,并基于所述事件判断所述新闻数据为第一类型新闻或者第二类型新闻;
[0007]在确定所述新闻数据为第一类型新闻的情况下,将所述新闻数据输入至第一事件判别器中,以基于所述第一事件判别器检索与所述新闻数据对应的历史事件,判断所述新闻数据是否为虚假新闻;
[0008]在确定所述新闻数据为第二类型新闻的情况下,将所述新闻数据输入至第二事件判别器中,以基于所述第二事件判别器判断所述新闻数据是否为虚假新闻;
[0009]其中,所述第二事件判别器包括虚假事件检测器和事件特征提取器;所述虚假事件检测器用于对所述文本特征进行识别,得到对应事件是虚假时间的概率;所述事件特征提取器用于基于所述概率对所述新闻数据进行分类,确定所述新闻数据是否为虚假新闻。
[0010]进一步地,所述虚假事件检测器是基于对抗生成网络进行虚假事件的迁移学习得到。
[0011]进一步地,所述对所述新闻数据进行特征提取,得到对应的文本特征,包括:
[0012]对所述新闻数据进行分词处理和词性标记,得到带标记的词语;
[0013]基于预训练的词嵌入模型学习得到所述带标记的词语对应的词向量;
[0014]基于所述词向量对所述新闻数据对应的句子向量进行降维处理,得到词嵌入向量;
[0015]基于所述词嵌入向量,得到所述文本特征。
[0016]进一步地,所述基于所述词嵌入向量,得到所述文本特征,包括:
[0017]将所述词嵌入向量输入至卷积滤波器,得到所述新闻数据中每个句子对应的特征
向量;
[0018]对所述特征向量进行最大池化处理,得到所述文本特征。
[0019]进一步地,所述基于所述文本特征从所述新闻数据中获取事件,并基于所述事件判断所述新闻数据为第一类型新闻或者第二类型新闻,包括:
[0020]基于所述文本特征从所述新闻数据中搜索关键词;
[0021]基于所述关键词从关键词新闻倒排索引表中检索相似新闻集;
[0022]确定所述相似新闻集中不同新闻的余弦相似度,基于所述相似新闻集中不同新闻的余弦相似度,对所述相似新闻集中的新闻进行聚类,得到所述关键词对应的事件集;
[0023]基于所述事件集将判断新闻数据为第一类型新闻或者第二类型新闻;
[0024]其中,所述关键词新闻倒排索引表包括多个预设关键词及每个预设关键词对应的新闻倒排表。
[0025]进一步地,所述基于所述事件集将判断新闻数据为第一类型新闻或者第二类型新闻,包括:
[0026]对所述事件集进行熵过滤,得到过滤后的事件;
[0027]对所述过滤后的事件进行LCS算法过滤,基于LCS算法过滤结果判断所述过滤后的事件为第一类型新闻或者第二类型新闻。
[0028]进一步地,所述基于所述关键词从关键词新闻倒排索引表中检索相似新闻集,包括:
[0029]确定所述关键词在所述关键词新闻倒排索引表中对应的每一条新闻对应的余弦相似度;
[0030]基于余弦相似度大于预设阈值的新闻构建所述相似新闻集。
[0031]本专利技术还提供一种虚假新闻检测装置,包括:
[0032]提取模块,用于获取待测的新闻数据,对所述新闻数据进行特征提取,得到对应的文本特征;
[0033]第一判断模块,用于基于所述文本特征从所述新闻数据中获取事件,并基于所述事件判断所述新闻数据为第一类型新闻或者第二类型新闻;
[0034]第二判断模块,用于在确定所述新闻数据为第一类型新闻的情况下,将所述新闻数据输入至第一事件判别器中,以基于所述第一事件判别器检索与所述新闻数据对应的历史事件,判断所述新闻数据是否为虚假新闻;
[0035]第三判断模块,用于在确定所述新闻数据为第二类型新闻的情况下,将所述新闻数据输入至第二事件判别器中,以基于所述第二事件判别器判断所述新闻数据是否为虚假新闻;
[0036]其中,所述第二事件判别器包括虚假事件检测器和事件特征提取器;所述虚假事件检测器用于对所述文本特征进行识别,得到对应事件是虚假时间的概率;所述事件特征提取器用于基于所述概率对所述新闻数据进行分类,确定所述新闻数据是否为虚假新闻。
[0037]本专利技术还提供一种电子设备,包括存储器和处理器,其中,
[0038]所述存储器,用于存储程序;
[0039]所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现如上述任意一项所述的虚假新闻检测方法中的步骤。
[0040]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的虚假新闻检测方法。
[0041]采用上述实现方式的有益效果是:本专利技术提供的虚假新闻检测方法、装置、电子设备及存储介质,通过待测的新闻数据对应文本特征从新闻数据中获取事件,并基于事件判断新闻数据为第一类型新闻或者第二类型新闻;在确定新闻数据为第一类型新闻的情况下,基于第一事件判别器检索与新闻数据对应的历史事件,判断新闻数据是否为虚假新闻;在确定新闻数据为第二类型新闻的情况下,基于第二事件判别器判断新闻数据是否为虚假新闻;其中,第二事件判别器包括虚假事件检测器和事件特征提取器;虚假事件检测器用于对文本特征进行识别,得到对应事件是虚假时间的概率;事件特征提取器用于基于概率对新闻数据进行分类,确定新闻数据是否为虚假新闻。本专利技术将新闻数据分为第一类型新闻和第二类型新闻,分别输入至不同的事件判别器进行虚假新闻判别,基于不同新闻之间的事件关联性实现对虚假新闻快速高效地检测虚假新闻。
附图说明
[0042]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本专利技术提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚假新闻检测方法,其特征在于,包括:获取待测的新闻数据,对所述新闻数据进行特征提取,得到对应的文本特征;基于所述文本特征从所述新闻数据中获取事件,并基于所述事件判断所述新闻数据为第一类型新闻或者第二类型新闻;在确定所述新闻数据为第一类型新闻的情况下,将所述新闻数据输入至第一事件判别器中,以基于所述第一事件判别器检索与所述新闻数据对应的历史事件,判断所述新闻数据是否为虚假新闻;在确定所述新闻数据为第二类型新闻的情况下,将所述新闻数据输入至第二事件判别器中,以基于所述第二事件判别器判断所述新闻数据是否为虚假新闻;其中,所述第二事件判别器包括虚假事件检测器和事件特征提取器;所述虚假事件检测器用于对所述文本特征进行识别,得到对应事件是虚假时间的概率;所述事件特征提取器用于基于所述概率对所述新闻数据进行分类,确定所述新闻数据是否为虚假新闻。2.根据权利要求1所述的虚假新闻检测方法,其特征在于,所述虚假事件检测器是基于对抗生成网络进行虚假事件的迁移学习得到。3.根据权利要求1所述的虚假新闻检测方法,其特征在于,所述对所述新闻数据进行特征提取,得到对应的文本特征,包括:对所述新闻数据进行分词处理和词性标记,得到带标记的词语;基于预训练的词嵌入模型学习得到所述带标记的词语对应的词向量;基于所述词向量对所述新闻数据对应的句子向量进行降维处理,得到词嵌入向量;基于所述词嵌入向量,得到所述文本特征。4.根据权利要求3所述的虚假新闻检测方法,其特征在于,所述基于所述词嵌入向量,得到所述文本特征,包括:将所述词嵌入向量输入至卷积滤波器,得到所述新闻数据中每个句子对应的特征向量;对所述特征向量进行最大池化处理,得到所述文本特征。5.根据权利要求1

4任一项所述的虚假新闻检测方法,其特征在于,所述基于所述文本特征从所述新闻数据中获取事件,并基于所述事件判断所述新闻数据为第一类型新闻或者第二类型新闻,包括:基于所述文本特征从所述新闻数据中搜索关键词;基于所述关键词从关键词新闻倒排索引表中检索相似新闻集;确定所述相似新闻集中不同新闻的余弦相似度,基于所述相似新闻集中不同新闻的余弦相似度,对所述相似新闻集中的新闻进行聚类,得到所述关键词对应的事件...

【专利技术属性】
技术研发人员:王欢魏小梅张永成沙瀛
申请(专利权)人:华中农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1