基于图神经网络的账户检测方法、装置和设备制造方法及图纸

技术编号:28503108 阅读:21 留言:0更新日期:2021-05-19 22:50
本发明专利技术示例性实施例提供一种基于图神经网络的账户检测方法,包括:以在线社交平台的账户为节点,账户与账户之间的关系为边,构建关系图;确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到;将所述关系图和所述特征表示输入预设的图神经网络模型,通过所述神经网络模型的输出结果确定所述关系图中的异常账户节点;所述预设的神经网络模型为:将所述关系图的节点和边转码为能够识别的向量数据,对所述向量数据进行权重参数的训练后,输出带有标签的节点预测值,根据所述节点预测值确定节点是否为异常账号。本发明专利技术使得账户检测的稳定性、效率和准确率均得到了大幅提升。和准确率均得到了大幅提升。和准确率均得到了大幅提升。

【技术实现步骤摘要】
基于图神经网络的账户检测方法、装置和设备


[0001]本专利技术示例性实施例涉及信息安全
,尤其涉及一种基于图神经网络的账户检测方法、装置和设备。

技术介绍

[0002]随着互联网的发展与移动终端设备的普及,在线社交平台愈发受网络用户青睐。OSN(OSN,Online Social Network,在线社交平台)是依托于在线社交平台上的一种信息网络,OSN由用户与信息构成,基于OSN的网络关系图由用户构成的节点与用户之间关系构成的边组成。保证以在线社交网络为载体所传递信息的安全是确保网络空间安全的重要组成部分。OSN的便利性为许多不法份子提供了犯罪机会,一种典型的攻击手段就是Sybil Attack,不法份子创建多个机器人账号(即异常账号)来传播不良信息、操纵舆论,是一种典型的危害网络信息安全的行为。
[0003]目前在线社交网络平台主要基于举报与半自动化的方式检测网络中存在的异常账号,缺乏一个公开的自动化检测工具来检测OSN中的异常账号。
[0004]有公司如Twitter所属公司采用自动化与人工相结合的方式检测异常账号,具体而言,公司采用一定技术监控大量账号的行为并发掘其中用到的行为模式,一旦发现账号的行为模式无法与正常行为模式相匹配时,需要人工对这些可疑账号展开调查以确认这些账号是否为异常账号。
[0005]另外有公司如新浪微博平台则使用基于先验知识的方法,设置某些特征规则比如关注量与粉丝比例、是否通过实名认证、是否有详细个人信息等等来判断某账号是否为可疑账号,同时,被用户多次举报的账号也会被列入可疑账号名单中。最终通过人工审核的方式确认风险账号是否为异常账号。
[0006]现有方法无法匹配日益复杂的异常账户检测,且目前尚无能够解决该问题的方法或装置。

技术实现思路

[0007]有鉴于此,本专利技术示例性实施例的目的在于提出一种基于图神经网络的账户检测方法、装置和设备,以解决传统方式中账户检测效率和准确率低下的问题。
[0008]基于上述目的,本专利技术示例性实施例提供了一种基于图神经网络的账户检测方法,包括:
[0009]以在线社交平台的账户为节点,账户与账户之间的关系为边,构建关系图;
[0010]确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到;
[0011]将所述关系图和所述特征表示输入预设的图神经网络模型,通过所述神经网络模型的输出结果确定所述关系图中的异常账户节点;
[0012]其中,所述预设的神经网络模型为:将所述关系图的节点和边转码为能够识别的
向量数据,对所述向量数据进行权重参数的训练后,输出带有标签的节点预测值,根据所述节点预测值确定节点是否为异常账号。
[0013]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述方法还包括:
[0014]预建立账户判断范围表,根据所述预设的图神经网络模型输出的节点预测值在所述账户判断范围表的匹配结果,确定节点是否为异常账号;
[0015]所述账户判断范围表包括第一数值范围和第二数值范围,当所述节点预测值处于第一范围时,确定所述节点预测值对应的节点为正常账户;当所述节点预测值处于第二范围时,确定所述节点预测值对应的节点为异常账户。
[0016]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述方法还包括:
[0017]确定源账号节点后,根据所述源账号节点的第一关系确定一阶关系图;
[0018]根据所述一阶关系图的各一阶账号节点的第二关系确定二阶关系图;
[0019]根据所述二阶关系图的各二阶账号节点的第三关系确定三阶关系图;
[0020]重复上述过程,直至获取所述源账号节点的第N关系确定的N阶关系图,其中,所述关系为节点关注与被关注的其它节点之间存在的关系。
[0021]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到,包括:
[0022]分别获取节点的账户信息和行为信息,所述账户信息包括简介信息和发布的文本信息,包括行为信息包括账户的活动信息;
[0023]分别对所述账户信息和行为信息进行聚合后编码,确定所述节点的向量数据。
[0024]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述方法还包括:对于每一种关系的邻居节点引入不同的权重参数,分别对属于同一种关系类型的邻居节点进行聚合后再进行不同类型关系之间的聚合;
[0025]通过以下公式进行所述节点之间的边关系的双重聚合:
[0026][0027]其中,R表示所述关系图中所有边的集合,表示与v
i
节点具有r关系的邻居集合,c
i,r
为归一化参数,一般取W
r
是具有r关系的邻居对应的权重参数,W
r
是节点自身对应的权重参数;
[0028]softmax函数与对应的Loss计算函数为:
[0029][0030][0031]其中y为有标签的节点的集合,表示输出层有标签的第i个节点的预测值。
[0032]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述方法还包括:
[0033]所述预设的图神经网络模型进行迭代训练至Loss计算函数变化幅度小于预定值时,确定此时所述关系图的各所述节点输出的概率值为所述预测值。
[0034]结合上述说明,在本专利技术实施例另一种可能的实施方式中,所述预设的图神经网络模型通过R

GCN算法实现聚合邻居的策略,以对复杂无向的关系图时加快训练和计算速度。
[0035]第二方面,本专利技术示例性实施例还提供了一种基于图神经网络的账户检测装置,包括:
[0036]图网络构建模块,用于以在线社交平台的账户为节点,账户与账户之间的关系为边,构建关系图;
[0037]特征确定模块,用于确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到;
[0038]判断模块,用于将所述关系图和所述特征表示输入预设的图神经网络模型,通过所述神经网络模型的输出结果确定所述关系图中的异常账户节点;
[0039]其中,所述预设的神经网络模型为:将所述关系图的节点和边转码为能够识别的向量数据,对所述向量数据进行权重参数的训练后,输出带有标签的节点预测值,根据所述节点预测值确定节点是否为异常账号。
[0040]第三方面,本专利技术还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于图神经网络的账户检测方法。
[0041]从上面所述可以看出,本专利技术示例性实施例提供的基于图神经网络的账户检测方法、装置和设备,提供了一种准确、高效的基于图神经网络的在线社交网络异常账号检测方法及系统,通过图神经网络技术,同时考虑在线社交网络信息流动图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的账户检测方法,其特征在于,包括:以在线社交平台的账户为节点,账户与账户之间的关系为边,构建关系图;确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到;将所述关系图和所述特征表示输入预设的图神经网络模型,通过所述神经网络模型的输出结果确定所述关系图中的异常账户节点;其中,所述预设的神经网络模型为:将所述关系图的节点和边转码为能够识别的向量数据,对所述向量数据进行权重参数的训练后,输出带有标签的节点预测值,根据所述节点预测值确定节点是否为异常账号。2.根据权利要求1所述的基于图神经网络的账户检测方法,其特征在于,所述方法还包括:预建立账户判断范围表,根据所述预设的图神经网络模型输出的节点预测值在所述账户判断范围表的匹配结果,确定节点是否为异常账号;所述账户判断范围表包括第一数值范围和第二数值范围,当所述节点预测值处于第一范围时,确定所述节点预测值对应的节点为正常账户;当所述节点预测值处于第二范围时,确定所述节点预测值对应的节点为异常账户。3.根据权利要求1所述的基于图神经网络的账户检测方法,其特征在于,所述方法还包括:确定源账号节点后,根据所述源账号节点的第一关系确定一阶关系图;根据所述一阶关系图的各一阶账号节点的第二关系确定二阶关系图;根据所述二阶关系图的各二阶账号节点的第三关系确定三阶关系图;重复上述过程,直至获取所述源账号节点的第N关系确定的N阶关系图,其中,所述关系为节点关注与被关注的其它节点之间存在的关系。4.根据权利要求1所述的基于图神经网络的账户检测方法,其特征在于,所述确定节点的特征表示,所述特征表示为分别提取所述节点的内容特征和行为特征进行聚合后得到,包括:分别获取节点的账户信息和行为信息,所述账户信息包括简介信息和发布的文本信息,所述行为信息包括账户的活动信息;分别对所述账户信息和行为信息进行聚合后编码,确定所述节点的向量数据。5.根据权利要求1所述的基于图神经网络的账户检测方法,其特征在于,所述方法还包括:对于每一种关系的邻居节点引入不同的权重参数,分别对属于同一种关系类型的邻居节点进行聚合后再进行不同类型关系之间的聚合;包括:通过以下公式进行节点之间的边关系的双重聚合:其中,R表示所述关系图中所有边的集合,表示与v
i
节...

【专利技术属性】
技术研发人员:徐国爱郭燕慧徐国胜张淼李思怡
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1