基于异构图神经网络的社交网络异常用户检测方法及设备技术

技术编号:28625126 阅读:48 留言:0更新日期:2021-05-28 16:21
本发明专利技术公开了一种基于异构图神经网络的社交网络异常用户检测方法及设备,基于异构图神经网络的社交网络异常用户检测方法,包括:针对社交网络收集用户信息,并对收集到的用户信息进行特征提取;基于提取的特征,构建基于社交网络的异构信息网络,并利用社交网络的关系属性设计相应的元路径和元图;基于异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示;基于用户在社交网络中的表示,检测用户类型,以确定异常用户。本发明专利技术整合了丰富的用户特征,基于真实的社交场景汇总用户信息形成了两个视角,即用户亲密程度和关系类型,模型具有出色的性能,在准确度和F1值上都表现较好。

【技术实现步骤摘要】
基于异构图神经网络的社交网络异常用户检测方法及设备
本专利技术涉及机器学习
,尤其涉及一种基于异构图神经网络的社交网络异常用户检测方法及设备。
技术介绍
社交网络是人们沟通交流的重要平台,在其影响力不断增长的今天,平台中也存在大量的异常用户影响着用户的正常使用,如僵尸用户、垃圾信息发布者、社交机器人等。需要对这些用户进行检测清除,以保证社交网络的正常使用。在现有的异常用户检测技术中,通常利用用户特征进行建模检测,多是传统的机器学习方法,利用随机森林,贝叶斯算法等技术进行分类。近期也有利用卷积神经网络(CNN)和长短期记忆网络等深度学习算法进行检测的方案。当前检测模型结构功能较为单一,大部分方案只能对某一类异常用户进行识别,比如恶意账号或者僵尸账号,却无法对其他类别的异常用户进行很好的检测识别。
技术实现思路
本专利技术实施例提供一种基于异构图神经网络的社交网络异常用户检测方法及设备,用以解决现有技术中的异常用户检测技术性能低的问题。根据本专利技术实施例的基于异构图神经网络的社交网络异常用户检测方法,包括:针对社交网络收集用户信息,并对收集到的用户信息进行特征提取;基于提取的特征,构建基于社交网络的异构信息网络,并利用社交网络的关系属性设计相应的元路径和元图;基于所述异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示;基于所述用户在社交网络中的表示,检测用户类型,以确定异常用户。根据本专利技术的一些实施例,所述对收集到的用户信息进行特征提取,包括:从收集到的用户信息中提取用户元特征、行为特征、以及文本语义特征;所述用户元特征包括以下特征中的至少一个:用户ID、用户昵称、展示昵称、链接、用户描述、注册时间、验证状态、关注者数目、关注数目、所属公共列表数量、喜爱的推文数目、推文数目、是否更改主页背景、以及推文保护状态;所述行为特征包括发布推文行为和评论行为;所述文本语义特征包括推文中的主题标签。根据本专利技术的一些实施例,所述基于提取的特征,构建基于社交网络的异构信息网络,包括:将用户、推文、评论和主题标签作为节点,将关注、发推、写评论、回复、转推和包含作为边,构建异构信息网络。根据本专利技术的一些实施例,所述基于所述异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示,包括:基于所述异构信息网络、元路径和元图,确定用户节点之间的连接类型,所述连接类型包括一跳连接和多跳连接;针对所述一跳连接,从用户之间的亲密度出发,聚合用户节点的邻居节点信息;针对所述多跳连接,从用户之间的相似度出发,聚合用户节点的邻居节点信息;基于聚合的用户节点的所有邻居节点信息,确定用户在社交网络中的表示。根据本专利技术的一些实施例,所述针对所述一跳连接,从用户之间的亲密度出发,聚合用户节点的邻居节点信息,包括:给定元路径和元图的集合为:S={s1,s2,…sm},对于给定的一组节点(x,y)通过路径si相连,根据公式1计算邻居节点y与用户节点x之间的亲密度为:其中,ux和uy分别表示用户节点x和邻居节点y的特征向量,为由si所决定的矩阵,σ表示激活函数;根据公式2计算邻居节点y的权重系数:根据公式3计算用户节点x在路径si下的表示为:其中,E表示采用多头注意力机制后用户连接次数;根据公式4计算路径si对于用户节点x的重要性:其中,为权值矩阵,为偏差,为权重向量;根据公式5计算路径Si的权重系数:根据公式6计算用户节点x在非线性转换层的表示:根据所述tx,计算用户表示矩阵T∈RN*F,N表示节点个数,F表示特征维数。根据本专利技术的一些实施例,所述针对所述多跳连接,从用户之间的相似度出发,聚合用户节点的邻居节点信息,包括:定义其中,Ki表示节点类型,矩阵表示节点Ki和Kj之间的邻接矩阵;根据公式7计算基于关系的用户间相似度USSI:其中,表示路径si的权重;基于所述USSI,构造权重矩阵M;基于所述M,根据公式8-9,使用卷积结构聚合信息:其中,IN表示单位矩阵,D为对角矩阵且满足Dii=∑jMij。根据本专利技术的一些实施例,所述基于聚合的用户节点的所有邻居节点信息,确定用户在社交网络中的表示,包括:根据公式10计算用户特征矩阵H:其中,σ1和σ2表示不同的激活函数,W(0)表示从输入层到隐藏层的可训练权重矩阵,W(1)表示从隐藏层到输出层的权重矩阵。根据本专利技术的一些实施例,所述基于所述用户在社交网络中的表示,检测用户类型,包括:基于所述用户特征矩阵H,采用LogisticRegression分类器对用户进行类型检测,所述用户的类型包括以下类型中的至少一种:正常用户、僵尸用户、垃圾信息散布者和社交机器人;所述LogisticRegression分类器的损失函数为:其中,V∧表示具有标签的用户节点索引集,yλ是一个二进制向量,yλ用于指示用户节点的标签,Pλ表示神经网络预测的概率。根据本专利技术实施例的基于异构图神经网络的社交网络异常用户检测设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的基于异构图神经网络的社交网络异常用户检测方法的步骤。根据本专利技术实施例的计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如上所述的基于异构图神经网络的社交网络异常用户检测方法的步骤。本专利技术实施例整合了丰富的用户特征,基于真实的社交场景汇总用户信息形成了两个视角,即用户亲密程度和关系类型,模型具有出色的性能,在准确度和F1值上都表现较好。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。在附图中:图1是本专利技术实施例中基于异构图神经网络的社交网络异常用户检测方法流程图;图2是本专利技术实施例中基于异构图神经网络的社交网络异常用户检测方法流程图;图3是本专利技术实施例中元路径示意图;图4是本专利技术实施例中元图示意图;图5是本专利技术实施例中基于异构图神经网络的社交网络异常用户检测设备架构图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应本文档来自技高网...

【技术保护点】
1.一种基于异构图神经网络的社交网络异常用户检测方法,其特征在于,包括:/n针对社交网络收集用户信息,并对收集到的用户信息进行特征提取;/n基于提取的特征,构建基于社交网络的异构信息网络,并利用社交网络的关系属性设计相应的元路径和元图;/n基于所述异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示;/n基于所述用户在社交网络中的表示,检测用户类型,以确定异常用户。/n

【技术特征摘要】
1.一种基于异构图神经网络的社交网络异常用户检测方法,其特征在于,包括:
针对社交网络收集用户信息,并对收集到的用户信息进行特征提取;
基于提取的特征,构建基于社交网络的异构信息网络,并利用社交网络的关系属性设计相应的元路径和元图;
基于所述异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示;
基于所述用户在社交网络中的表示,检测用户类型,以确定异常用户。


2.如权利要求1所述的方法,其特征在于,所述对收集到的用户信息进行特征提取,包括:
从收集到的用户信息中提取用户元特征、行为特征、以及文本语义特征;
所述用户元特征包括以下特征中的至少一个:用户ID、用户昵称、展示昵称、链接、用户描述、注册时间、验证状态、关注者数目、关注数目、所属公共列表数量、喜爱的推文数目、推文数目、是否更改主页背景、以及推文保护状态;
所述行为特征包括发布推文行为和评论行为;
所述文本语义特征包括推文中的主题标签。


3.如权利要求2所述的方法,其特征在于,所述基于提取的特征,构建基于社交网络的异构信息网络,包括:
将用户、推文、评论和主题标签作为节点,将关注、发推、写评论、回复、转推和包含作为边,构建异构信息网络。


4.如权利要求3所述的方法,其特征在于,所述基于所述异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示,包括:
基于所述异构信息网络、元路径和元图,确定用户节点之间的连接类型,所述连接类型包括一跳连接和多跳连接;
针对所述一跳连接,从用户之间的亲密度出发,聚合用户节点的邻居节点信息;
针对所述多跳连接,从用户之间的相似度出发,聚合用户节点的邻居节点信息;
基于聚合的用户节点的所有邻居节点信息,确定用户在社交网络中的表示。


5.如权利要求4所述的方法,其特征在于,所述针对所述一跳连接,从用户之间的亲密度出发,聚合用户节点的邻居节点信息,包括:
给定元路径和元图的集合为:S={s1,s2,…sm},对于给定的一组节点(x,y)通过路径si相连,根据公式1计算邻居节点y与用户节点x之间的亲密度为:



其中,ux和uy分别表示用户节点x和邻居节点y的特征向量,为由si所决定的矩阵,σ表示激活函数;
根据公式2计算邻居节点y的权重系数:



根据公式3计算用户节点x在路径si下的表示为:



其中,E表示采用多头注意力机制后用户连接次数;...

【专利技术属性】
技术研发人员:李阳阳刘弋锋武文翰金昊郭庆浪曹银浩彭浩杨阳朝石珺
申请(专利权)人:中国电子科技集团公司电子科学研究院深圳市网联安瑞网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1