一种基于动态加权图卷积的异常用户检测方法及存储介质技术

技术编号:38514140 阅读:16 留言:0更新日期:2023-08-19 16:56
本发明专利技术公开了一种基于动态加权图卷积的异常用户检测方法及存储介质,在表示层采用知识图谱嵌入技术来捕捉用户之间的多种交互关系信息;在分类层采用图卷积技术作为分类模型,将用户分为正常用户与异常用户;采用图卷积技术实现用户间信息的传播,结合信任传播规则,在聚合邻居信息时,通过动态加权图卷积算子,区分不同邻居节点的重要度,对聚合的邻居信息进行过滤。本发明专利技术将知识图谱嵌入技术与社交网络异常用户检测相结合,自动学习用户间的多关系信息;采用图卷积技术实现用户间信息的传播;并且考虑了关系的非对称性,在聚合邻居信息时,通过动态加权图卷积算子,区分不同邻居节点的重要度,对聚合的邻居信息进行过滤,有效地提升了检测性能。有效地提升了检测性能。有效地提升了检测性能。

【技术实现步骤摘要】
一种基于动态加权图卷积的异常用户检测方法及存储介质


[0001]本专利技术属于异常用户检测的
,具体涉及一种基于动态加权图卷积的异常用户检测方法及存储介质。

技术介绍

[0002]社交网络的概念最早由Barnes于1954年提出,主要是指人类通过互联网实现社交的一种新形式。近年来,随着科技的进步,在线社交网络(online social network,OSN)满足了人们多方面的需求,现如今,社交网站已经成为人们相互联系、分享信息、感情、照片、帖子、状态等的一个广阔平台,与人们的工作、生活深度融合。国内知名在线社交网络平台——新浪微博的2021年财务报表显示,2021年9月的月活跃用户数达到了5.73亿。在线社交网络应用的出现与迅猛发展,使得人们对互联网的使用方式产生了深刻变革——由简单信息搜索和网页浏览转向网上社会关系的构建与维护、基于社会关系的信息创造、交流和共享,为世界各地的个人提供了一种信息共享的模式。然而,随着在线社交网络的爆炸式发展,也吸引着许多非法用户将其看作是牟取利益的工具,国外的Twitter、Facebook,以及国内的新浪微博、网易等在线社交应用中的许多用户经常受到各种异常用户带来的困扰。社交网络异常用户层出不穷:实施恶意行为、传播恶意信息的恶意用户,不参与正常的在线社交活动,以追随、热捧其他用户、话题为主要目的僵尸用户,发布垃圾信息、不良信息的垃圾用户,以及批量注册生成的虚假账户等。中国互联网信息安全中心发布的第48期《中国互联网发展报告》显示,在网民遭遇各类网络安全问题中,网络诈骗高居第二,其中大多数网络诈骗都是由发布虚假信息所引起的。这些异常用户使得社交平台的正常运行发展受到了扰乱,对公众的利益也带来了许多潜在的威胁,对网络环境与社会皆造成了不良的影响。由于这些原因,识别异常用户是社交网络研究领域的一个重要课题,对打击网络诈骗、净化网络环境、维护社会稳定等具有重要作用。
[0003]对异常用户的检测问题,其本质是一个二分类问题,通过构造检测模型将用户识别为正常用户或异常用户。现有的工作常基于属性特征和内容特征对异常用户进行检测,例如Kudugunta等人提出的方法,结合长短期记忆架构的深度神经网络,同时利用了用户发布内容(user generated content,UGC)和用户属性信息在推特级别上检测社交机器人。Tan等人采用UGC中包含的链接,形成一个用户

链接图,提出了一个无监督检测方法。Rout等人通过集成信任计算模型和基于链接的MSBD特性,提出了LA

MSBD模型,该模型通过执行有限组学习动作来更新参与者在推文中发布恶意链接的概率。Zhao等人通过UGC中包含的事件词和域词从时间相似度、空间相似度、文本相似度来衡量用户发布内容和新闻之间的相似性,作为用户生成信息的初始可信度,再进一步采用信任传播方法,来检测异常用户。
[0004]基于关系特征的方法有很多,比如与图神经网络相结合,在图模型中,通常认为节点的类别与它们的近邻节点的类别相关联,例如文献都是采用图神经网络作为分类器;还有从行为模式入手,例如蒋朦通过分析异常用户可疑行为的同步性和密集性等特征,提出了一种新颖的可疑行为检测方法CatchSync,能自动从大规模图中区分可疑节点。
[0005]在检测技术发展的同时,异常用户也会实施一些伪装行为来逃避检测,例如异常用户之间通过恶意互粉、添加好友、点赞等可以操纵个人资料的特征,如hashtag比率、关注者比率、URL比率和转发数等;还可以操纵发布内容特征,比如情感词汇、表情符号和常用的词汇等,使其对检测器具有欺骗性,从而会出现文献提到的spammer drift现象,这对基于属性特征和内容特征的方法来说很严重的一个问题,异常用户的特征随着时间变化波动,而正常用户的特征保持稳定,因此过去数据训练的分类器不能用于检测新数据集中的异常用户。用户之间的关系是一种稳健性较高的特征,因为异常用户无法轻易操纵用户的交互行为。以往工作往往只考虑了用户之间单一的社交关系,忽略了社交网络是一个复杂网络结构,包含着多种交互关系。

技术实现思路

[0006]本专利技术旨在通过结合知识图谱嵌入技术,学习节点之间多种交互关系信息,基于节点之间的多关系信息检测异常用户。
[0007]本专利技术主要通过以下技术方案实现:
[0008]一种基于动态加权图卷积的异常用户检测方法,包括以下步骤:
[0009]步骤S100:针对在线社交网络的多关系特征,在表示层采用知识图谱嵌入技术来捕捉用户之间的多种交互关系信息;
[0010]步骤S200:在分类层采用图卷积技术作为分类模型,将用户分为正常用户与异常用户;采用图卷积技术实现用户间信息的传播,结合信任传播规则,在聚合邻居信息时,通过动态加权图卷积算子,区分不同邻居节点的重要度,对聚合的邻居信息进行过滤;
[0011]步骤S300:对于不平衡数据集,采用欠采样方法进行抽样,采用抽样得到的平衡样本子集对分类模型进行优化训练,基于训练后的模型检测异常用户。
[0012]为了更好地实现本专利技术,进一步地,所述步骤S100中,采用知识图谱嵌入技术对多关系社交网络中的节点进行向量化表示;采用TransE模型将在线社交网络OSN中的节点和关系嵌入到R
d0
,其中R
d0
为维数为d0的向量空间,将在线社交网络OSN的每个三元组实例(h,l,t)中的关系l看作是从实体h到实体t的翻译,通过不断调整h,l,t,尽可能使得h+l≈t,反之,当不包含这个三元组时,h+l应当远离t。
[0013]为了更好地实现本专利技术,进一步地,所述步骤S100中,表示层的损失函数如下:
[0014][0015]其中,S为抽象用户交互行为得到的多关系有向社交图,
[0016]S'为负样本,
[0017][x]+
=max(x,0),
[0018]S

(h,l,t)
={(h

,l,t)|h

∈E}∪{(h,l,t

)|t

∈E},E表示图中边的集合,
[0019][0020]γ>0,表示边缘;
[0021]通过迭代训练最小化损失函数,得到社交网络中节点和关系的嵌入表示,然后输入到分类层用于后续的检测工作。
[0022]为了更好地实现本专利技术,进一步地,所述步骤S200中,初步采用多关系图卷积实现用户间信息的传递,聚集用户的邻居信息,初步的每一层的输出计算如下:
[0023][0024][0025]其中,f为激活函数,
[0026]为第k层关系关于r∈R的权重参数矩阵,
[0027]d
k
为第k层输出向量的维度,
[0028]A为节点的邻接矩阵,
[0029]I为单位矩阵,
[0030]为正则化后的邻接矩阵,
[0031]H
k
...

【技术保护点】

【技术特征摘要】
1.一种基于动态加权图卷积的异常用户检测方法,其特征在于,包括以下步骤:步骤S100:针对在线社交网络的多关系特征,在表示层采用知识图谱嵌入技术来捕捉用户之间的多种交互关系信息;步骤S200:在分类层采用图卷积技术作为分类模型,将用户分为正常用户与异常用户;采用图卷积技术实现用户间信息的传播,结合信任传播规则,在聚合邻居信息时,通过动态加权图卷积算子,区分不同邻居节点的重要度,对聚合的邻居信息进行过滤;步骤S300:对于不平衡数据集,采用欠采样方法进行抽样,采用抽样得到的平衡样本子集对分类模型进行优化训练,基于训练后的模型检测异常用户。2.根据权利要求1所述的一种基于动态加权图卷积的异常用户检测方法,其特征在于,所述步骤S100中,采用知识图谱嵌入技术对多关系社交网络中的节点进行向量化表示;采用TransE模型将在线社交网络OSN中的节点和关系嵌入到R
d0
,其中R
d0
为维数为d0的向量空间,将在线社交网络OSN的每个三元组实例(h,l,t)中的关系l看作是从实体h到实体t的翻译,通过不断调整h,l,t,尽可能使得h+l≈t,反之,当不包含这个三元组时,h+l应当远离t。3.根据权利要求2所述的一种基于动态加权图卷积的异常用户检测方法,其特征在于,所述步骤S100中,表示层的损失函数如下:其中,S为抽象用户交互行为得到的多关系有向社交图,S'为负样本,[x]
+
=max(x,0),S

(h,l,t)
={(h

,l,t)|h

∈E}∪{(h,l,t

)|t

∈E},E表示图中边的集合,γ>0,表示边缘;通过迭代训练最小化损失函数,得到社交网络中节点和关系的嵌入表示,然后输入到分类层用于后续的检测工作。4.根据权利要求1所述的一种基于动态加权图卷积的异常用户检测方法,其特征在于,所述步骤S200中,初步采用多关系图卷积实现用户间信息的传递,聚集用户的邻居信息,初步的每一层的输出计算如下:步的每一层的输出计算如下:其中,f为激活函数,为第k层关系关于r∈R的权重参数矩阵,d
k
为第k层输出向量的维度,...

【专利技术属性】
技术研发人员:易舒婷张剑凯周韵黄琬庭宋雨灿黄可欣张一弛唐鸿锐李岳洋曹琳玲张学虹邓旭聪陈浪张芳吴寿勇杜德道付饶何军杨伶俐
申请(专利权)人:国网四川省电力公司广安供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1