基于三元图卷积神经网络的社交机器人检测系统及方法技术方案

技术编号:37702973 阅读:14 留言:0更新日期:2023-06-01 23:49
本发明专利技术属于社交网络技术领域,具体涉及一种基于三元图卷积神经网络的社交机器人检测系统及方法,该方法包括对社交网络提取账户的语义特征、属性特征和社区结构特征;对语义特征、属性特征和社区结构特征向量化,特征向量通过拼接方式融合形成账户初始表示向量;使用关注

【技术实现步骤摘要】
基于三元图卷积神经网络的社交机器人检测系统及方法


[0001]本专利技术属于社交网络
,具体涉及一种基于三元图卷积神经网络的社交机器人检测系统及方法。

技术介绍

[0002]恶意社交机器人是由自动化程序或者API控制的并在社交网络中执行各种恶意活动社交账户,这类账户被研究者称为bot accounts、Sybils、或者fake accounts。在线社交网络在营销、新闻、公共关系、大众信息活动、娱乐以及全球和国家重大活动中的爆炸性使用为社交机器人的发展提供了机会。
[0003]社交平台和研究者们为了尽可能降低恶意社交机器人的影响,提出了一系列社交机器人检测技术,并在早期取得了成功。这些检测方法可以归为两类:基于账户特征的方法和基于图结构的方法。现有的最先进的基于账户特征的方法有三个主要的局限性:1、它包含人类的局限和偏见。2、需要从大量数据中挖掘潜在的特征,特征工程的成本很高。3、模型的泛化能力因不同OSN存在不同的特征而受到限制。
[0004]为了应对这些挑战,部分研究者利用账户在社交网络中的交互关系构建社交图,使用图挖掘技术将其划分为内聚子图。这类方法通常仅考虑利用在线社交网络中社交机器人的链接关系,而忽略了嵌入在文本、时间和简介信息中的自动化线索。因此,这些方法无法检测出那些成功地与普通用户建立了足够攻击边缘(链接)的社交机器人。

技术实现思路

[0005]针对现有技术中存在的问题,本专利技术提出一种基于三元图卷积神经网络的社交机器人检测系统及方法,同时考虑了账户的语义特征、属性特征和社区结构特征,采用多元特征嵌入图神经网络检测社交机器人,提高了对社交机器人检测的准确性。
[0006]为了实现上述目的,本专利技术采用以下的技术方案:
[0007]本专利技术提供了一种基于三元图卷积神经网络的社交机器人检测系统,包括:
[0008]输入模块,对社交网络提取账户的语义特征、属性特征和社区结构特征;
[0009]预处理模块,对语义特征、属性特征和社区结构特征向量化,利用全连接将得到的特征向量进行缩放,使特征向量维度一致,特征向量再通过拼接方式融合形成账户初始表示向量;
[0010]节点表示模块,将预处理模块得到的账户初始表示向量作为每个账户的初始特征,使用关注

被关注关系构建有向图,利用图神经网络消息传递机制聚合节点邻居特征和初始特征,利用交叉熵损失函数作为图神经网络的损失函数,训练图神经网络得到最终的节点表示向量;
[0011]输出模块,将最终的节点表示向量通过图神经网络的softmax层分类为社交机器人或者正常用户。
[0012]进一步地,所述语义特征包括账户描述信息和账户推文信息,所述属性特征包括
数字信息和类别信息,所述社区结构特征包括账户社区结构信息。
[0013]进一步地,使用RoBERTa模型分别对账户描述信息和账户推文信息进行编码后得到账户描述信息的表示向量和账户推文信息的表示向量;表示为:给定账户l的语义特征向量由账户描述信息语义向量和账户推文信息语义向量两部分组成,即U
l
∈U。
[0014]进一步地,使用Z

Score对属性特征中的数字信息归一化处理并组合成数字特征向量使用One

hot对属性特征中的类别信息编码并组合成类别特征向量最终得到给定账户l的属性特征向量
[0015]进一步地,社区检测算法DANMF利用编码器和解码器优化节点从属每个社区的概率,得到每个节点属于每个社区的概率向量,即社区结构特征向量
[0016]进一步地,账户l的初始表示向量表示为
[0017]进一步地,利用图神经网络提取账户的邻居特征,同时融合语义特征向量属性特征向量和社区结构特征向量
[0018]进一步地,将最终的节点表示向量U
i
,通过图神经网络的softmax层分类,表示为:W
o
、b
o
是softmax层可学习参数。
[0019]本专利技术还提供了一种基于三元图卷积神经网络的社交机器人检测方法,包括以下步骤:
[0020]对社交网络提取账户的语义特征、属性特征和社区结构特征;
[0021]对语义特征、属性特征和社区结构特征向量化,利用全连接将得到的特征向量进行缩放,使特征向量维度一致,特征向量再通过拼接方式融合形成账户初始表示向量;
[0022]将预处理模块得到的账户初始表示向量作为每个账户的初始特征,使用关注

被关注关系构建有向图,利用图神经网络消息传递机制聚合节点邻居特征和初始特征,利用交叉熵损失函数作为图神经网络的损失函数,训练图神经网络得到最终的节点表示向量;
[0023]将最终的节点表示向量通过图神经网络的softmax层分类为社交机器人或者正常用户。
[0024]与现有技术相比,本专利技术具有以下优点:
[0025]为了解决机器人账户模仿人类账户某些维度特征逃逸检测的问题,本专利技术提出一种基于三元图卷积神经网络的社交机器人检测系统,能够联合使用账户的语义特征、属性特征和社区结构特征,将这三类特征向量化后进行融合形成账户初始表示向量作为每个账户的初始特征,再利用图神经网络聚合节点邻居特征和初始特征,最后利用嵌入多元特征的图神经网络检测社交机器人。与单一维度特征对社交机器人的检测相比,本专利技术大大提高了社交机器人的检测准确性。
附图说明
[0026]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本专利技术实施例的基于三元图卷积神经网络的社交机器人检测系统的框架图;
[0028]图2是本专利技术实施例的转推数分布情况图;
[0029]图3是本专利技术实施例的语义向量距离分布情况图;
[0030]图4是本专利技术时实施例的RGCN捕获账户邻居信息(N)以及RGCN嵌入账户语义信息(S)、账户属性信息(P)和账户社区结构信息(C)之后Accuracy、F1

Score和Precision变化情况图;
[0031]图5是本专利技术实施例的基于三元图卷积神经网络的社交机器人检测方法的流程示意图。
具体实施方式
[0032]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0033]如图1所示,本实施例的基于三元图卷积神经网络的社交机器人检测系统包括输入模块、预处理模块、节点表示模块和输出模块。下面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于三元图卷积神经网络的社交机器人检测系统,其特征在于,包括:输入模块,对社交网络提取账户的语义特征、属性特征和社区结构特征;预处理模块,对语义特征、属性特征和社区结构特征向量化,利用全连接将得到的特征向量进行缩放,使特征向量维度一致,特征向量再通过拼接方式融合形成账户初始表示向量;节点表示模块,将预处理模块得到的账户初始表示向量作为每个账户的初始特征,使用关注

被关注关系构建有向图,利用图神经网络消息传递机制聚合节点邻居特征和初始特征,利用交叉熵损失函数作为图神经网络的损失函数,训练图神经网络得到最终的节点表示向量;输出模块,将最终的节点表示向量通过图神经网络的softmax层分类为社交机器人或者正常用户。2.根据权利要求1所述的基于三元图卷积神经网络的社交机器人检测系统,其特征在于,所述语义特征包括账户描述信息和账户推文信息,所述属性特征包括数字信息和类别信息,所述社区结构特征包括账户社区结构信息。3.根据权利要求2所述的基于三元图卷积神经网络的社交机器人检测系统,其特征在于,使用RoBERTa模型分别对账户描述信息和账户推文信息进行编码后得到账户描述信息的表示向量和账户推文信息的表示向量;表示为:给定账户l的语义特征向量由账户描述信息语义向量和账户推文信息语义向量两部分组成,即4.根据权利要求3所述的基于三元图卷积神经网络的社交机器人检测系统,其特征在于,使用Z

Score对属性特征中的数字信息归一化处理并组合成数字特征向量使用One

hot对属性特征中的类别信息编码并组合成类别特征向量最终得到...

【专利技术属性】
技术研发人员:杨春芳刘峰李震宇刘粉林巩道福罗向阳刘琰齐保军朱玛
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1