System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分析领域,尤其涉及一种基于用户信息与互动信息的虚假新闻检测方法及系统。
技术介绍
1、近年来,随着互联网技术的快速发展,网络社交媒体平台的使用迅速增加,而网络社交媒体平台服务构成了一个重要的信息来源,为公众获取信息提供了一种新渠道。网络社交媒体平台已经成为用户获取信息、表达意见、相互交流的便捷网络平台。随着越来越多人热衷于在社交媒体上参与热点话题的讨论,表达自己的意见和见解,在社交媒体中蕴涵了大量的信息,而这些信息里面也充斥着各种各样的谣言,假新闻在社交媒体中传播也是同样简单、快捷,并且由于虚假信息在可以通过在社会面上的广泛传播获得强大的穿透力量,给社会带来巨大的危害,造成群众性的恐慌,造成大量的经济损失。因此,针对这些社交平台上的假新闻可能造成的恐慌和威胁,迫切的需要拿出一种方法,尽量快速有效的识别社交媒体上的假新闻。
2、现有关于假新闻检测的方法主要还是单一模式方法,以提取文本特征为主,或者利用多模态加入图像数据,运用计算机视觉方面技术对相应新闻图像信息进行利用,但并没有利用上社交平台上用户具体的背景信息(如账号时间、上线时间、关注数、粉丝数等)和用户直接丰富的交互信息(如转发、评论、关注等),忽略了发布者和用户信息对于假新闻的检测重要性,进而会存在检测准确率不佳的问题。
技术实现思路
1、有鉴于此,为了解决虚假新闻检测方法中没有考虑用户信息和用户交互信息的影响,进而导致检测准确率不高的技术问题,第一方面,本专利技术提出一种基于用户信息与互动信息的
2、将用户信息输入至预训练的多层感知机,得到用户预得分;
3、对待测新闻的文本数据进行特征提取,得到文本特征;
4、构建用户交互图并结合所述用户预得分,生成用户特征;
5、构建用户发布图并结合所述用户预得分,生成用户发布特征;
6、根据所述文本特征、所述用户特征和所述用户发布特征,进行待测新闻检测,得到检测结果。
7、在一些实施例中,所述将用户信息输入至预训练的多层感知机,得到用户预得分这一步骤,其具体包括:
8、基于社交机器人数据集训练多层感知机,得到预训练的多层感知机;
9、将用户信息转为信息特征,并作为预训练的多层感知机的输入,得到用户预得分。
10、通过该优选步骤,利用预训练的社交机器人检测模型对用户信息进行利用,对用户有预先的得分判断,有助于后续步骤的利用。
11、在一些实施例中,所述对待测新闻的文本数据进行特征提取,得到文本特征这一步骤,其具体包括:
12、对待测新闻的文本数据进行清洗和分词处理,得到预处理后的文本数据;
13、将所述预处理后的文本数据作为表征转换模型的输入,进行特征提取,得到文本特征。
14、通过该优选步骤,对文本数据进行简单的预处理和特征提取,可以在节省计算量的同时提高检测速度。
15、在一些实施例中,所述构建用户交互图并结合所述用户预得分,生成用户特征这一步骤,其具体包括:
16、根据用户之间的交互信息,构建用户交互图;
17、基于图注意力机制对所述节点之间的交互信息进行捕获,结合所述用户预得分调整节点的关注度,得到用户特征。
18、其中,所述用户特征的生成过程表示如下:
19、
20、
21、其中,u(0)表示用户交互图的节点初始特征,表示用户预得分,表示用户特征,gat(·)表示图注意力网络。
22、通过该优选步骤,利用用户交互图和图注意力机制对用户节点之间相互交互的重要性进行捕捉,以得到用户特征。
23、在一些实施例中,所述构建用户发布图并结合所述用户预得分,生成用户发布特征这一步骤,其具体包括:
24、根据待测新闻的用户所发布的帖子,构建用户发布图;
25、以帖子的文本特征作为帖子节点的源节点特征,得到用户发布图中的节点初始特征;
26、基于图卷积神经网络,对所述用户发布图中的节点初始特征进行聚集,结合所述用户预得分,得到用户发布特征。
27、其中,所述用户发布特征的生成过程表示如下:
28、p(1)=gcn(p)
29、
30、其中,p表示用户发布图中的节点初始特征,gcn(·)表示图卷积神经网络,表示该用户发布图对应的用户预得分,表示用户发布特征。
31、通过该优选步骤,利用用户发布图和图卷积神经网络对用户发布的帖子内容特征进行聚合,以得到用户发布特征。
32、在一些实施例中,所述根据所述文本特征、所述用户特征和所述用户发布特征,进行待测新闻检测,得到检测结果这一步骤,其具体包括:
33、将所述文本特征、所述用户特征和所述用户发布特征进行拼接,得到最终表示;
34、将所述最终表述经过全连接和分类层,完成待测新闻的检测分类,得到检测结果。
35、通过该优选步骤,结合文本特征、用户表示特征和用户发布特征进行检测,能够克服现有检测方法中没有对这些丰富的信息进行利用,进而导致的检测准确率不高的问题。
36、第二方面,本专利技术提出了一种基于用户信息与互动信息的虚假新闻检测系统,所述系统包括:
37、社交机器人模块,用于将用户信息输入至预训练的多层感知机,得到用户预得分;
38、文本内容提取模块,用于对待测新闻的文本数据进行特征提取,得到文本特征;
39、用户交互模块,用于构建用户交互图并结合所述用户预得分,生成用户特征;
40、用户帖子信息聚合模块,用于构建用户发布图并结合所述用户预得分,生成用户发布特征;
41、假新闻检测模块,用于根据所述文本特征、所述用户特征和所述用户发布特征,进行待测新闻检测,得到检测结果。
42、本专利技术还提出了一种基于用户信息与互动信息的虚假新闻检测装置,包括:
43、至少一个处理器;
44、至少一个存储器,用于存储至少一个程序;
45、当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如上所述一种基于用户信息与互动信息的虚假新闻检测方法。
46、基于上述方案,本专利技术提供了一种基于用户信息与互动信息的虚假新闻检测方法及系统,能有效利用用户信息和用户互动结构信息,利用预训练的检测模型对用户信息进行利用,对用户有预先的得分判断,并对后续传播结构方面加以利用,最后对社交网络上的待测新闻进行判别,以实现更好的检测效果。
本文档来自技高网...【技术保护点】
1.一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述将用户信息输入至预训练的多层感知机,得到用户预得分这一步骤,其具体包括:
3.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述对待测新闻的文本数据进行特征提取,得到文本特征这一步骤,其具体包括:
4.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述构建用户交互图并结合所述用户预得分,生成用户特征这一步骤,其具体包括:
5.根据权利要求4所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述用户特征的生成过程表示如下:
6.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述构建用户发布图并结合所述用户预得分,生成用户发布特征这一步骤,其具体包括:
7.根据权利要求6所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述用户发布特征的生成
8.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述根据所述文本特征、所述用户特征和所述用户发布特征,进行待测新闻检测,得到检测结果这一步骤,其具体包括:
9.一种基于用户信息与互动信息的虚假新闻检测系统,其特征在于,包括:
10.一种基于用户信息与互动信息的虚假新闻检测装置,其特征在于,包括:
...【技术特征摘要】
1.一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述将用户信息输入至预训练的多层感知机,得到用户预得分这一步骤,其具体包括:
3.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述对待测新闻的文本数据进行特征提取,得到文本特征这一步骤,其具体包括:
4.根据权利要求1所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述构建用户交互图并结合所述用户预得分,生成用户特征这一步骤,其具体包括:
5.根据权利要求4所述一种基于用户信息与互动信息的虚假新闻检测方法,其特征在于,所述用户特征的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。