识别关键异常用户的方法、装置、电子设备和介质制造方法及图纸

技术编号:38136283 阅读:8 留言:0更新日期:2023-07-08 09:47
提供了一种识别关键异常用户的方法、装置、电子设备和介质,可以应用于大数据技术领域、人工智能技术领域和信息安全技术领域。所述方法包括:获取第一异常用户网络;分析第一异常用户网络,以获得第一异常用户网络的结构特征;从第一异常用户网络中去除部分节点和边,以获得第二异常用户网络,第二异常用户网络的结构特征与第一异常用户网络的结构特征一致;利用影响力最大化算法分析第二异常用户网络,以获得关键异常用户的集合。通过简化原始的异常用户网络的规模,过滤了网络中影响力较低的节点,但不影响网络的整体结构特征,从而在保证关键异常用户识别的准确率不受影响的情况下,降低了影响力最大化算法的时间复杂度,节约了算力资源。节约了算力资源。节约了算力资源。

【技术实现步骤摘要】
识别关键异常用户的方法、装置、电子设备和介质


[0001]本专利技术涉及大数据
、人工智能
和信息安全
,更具体地涉及一种识别关键异常用户的方法、装置、电子设备和介质。

技术介绍

[0002]异常用户群体网络可以看作是一种社交网络,社交网络由于不同的拓扑结构而具有不同的特点。社交网络中的影响力扩散主要依赖于构建的网络模型,依靠用户节点与节点之间的关系网,将用户固定在网络中。社交网络让处于网络中的用户联系更为紧密,可以使用户节点影响力在小范围、高密度的用户群中快速传播并扩散,达到用户之间的深层次互动。
[0003]目前,一方面,异常用户影响力分析主要是从异常用户本身及其用户之间的关联关系进行分析,很少关注整个异常用户群体关联的网络结构特征,造成异常群体之间的很多隐藏信息难以挖掘,不利于对异常的精准防护,即识别关键异常用户的准确度较低。另一方面,在实际生活中,异常用户网络通常比较庞大,拥有较多的节点和边。在这类网络中利用影响力最大化算法分析节点用户影响力较为复杂,算法的时间复杂度较高,导致计算量挑战很大。

技术实现思路

[0004]鉴于上述问题,根据本专利技术的第一方面,本专利技术的实施例提供了一种识别关键异常用户的方法,所述方法包括:获取第一异常用户网络,其中,所述第一异常用户网络包括m1个节点和n1个边,各个节点表示各个异常用户,各个边表示各个异常用户之间的关联关系,m1、n1均为大于等于3的正整数;分析所述第一异常用户网络,以获得所述第一异常用户网络的结构特征;从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,其中,所述第二异常用户网络包括m2个节点和n2个边,所述第二异常用户网络的结构特征与所述第一异常用户网络的结构特征一致,m2和n2均为大于等于2的正整数,m3和n3均为大于等于1的正整数,m2和m3均小于m1,n2和n3均小于n1;利用影响力最大化算法分析所述第二异常用户网络,以获得关键异常用户的集合,其中,所述关键异常用户的集合包括k个异常用户,所述k个异常用户为所述第二异常用户网络中的影响力从大至小排在前k位的节点,k为大于等于1的正整数,k小于m2。
[0005]根据一些示例性实施例,所述分析所述第一异常用户网络,以获得所述第一异常用户网络的结构特征,具体包括:分析所述第一异常用户网络,以获得所述第一异常用户网络的整体结构特征值和局部结构特征值;根据所述第一异常用户网络的整体结构特征值和局部结构特征值,确定所述第一异常用户网络的类型;根据所述第一异常用户网络的类型、整体结构特征值和局部结构特征值,确定所述第一异常用户网络的结构特征。
[0006]根据一些示例性实施例,所述第一异常用户网络的整体结构特征值包括所述第一异常用户网络的各个节点的度、各个边的介数、第一异常用户网络的聚类系数和平均路径
长度;和/或,所述第一异常用户网络的局部结构特征值包括度相关性和介数相关性。
[0007]根据一些示例性实施例,所述从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,具体包括:网络简化子步骤,根据所述第一异常用户网络的度分布和介数分布,确定度阈值和介数阈值;从所述第一异常用户网络中去除度小于所述度阈值的节点,以及,从所述第一异常用户网络中去除介数小于所述介数阈值的边,以获得中间异常用户网络。
[0008]根据一些示例性实施例,所述从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,还具体包括:分析所述中间异常用户网络,以获得所述中间异常用户网络的结构特征;比较所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征;如果所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征不一致,调整所述度阈值和所述介数阈值,重复执行所述网络简化子步骤,直至所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征一致;以及将与所述第一异常用户网络的结构特征一致的中间异常用户网络作为所述第二异常用户网络。
[0009]根据一些示例性实施例,所述利用影响力最大化算法分析所述第二异常用户网络,以获得关键异常用户的集合,具体包括:针对所述第二异常用户网络中的每一个节点v,构造有向无环图,以获得m2个有向无环图,其中,每一个节点v分布在多个有向无环图中;在m2个有向无环图中的每一个有向无环图的范围内,分别计算各个节点在该有向无环图中的影响力;针对所述第二异常用户网络中的每一个节点v,获取该节点v在分布的多个有向无环图中的多个影响力,并叠加该节点v的所述多个影响力,以获得该节点v在所述第二异常用户网络中的总影响力。
[0010]根据一些示例性实施例,所述利用影响力最大化算法分析所述第二异常用户网络,以获得关键异常用户的集合,还具体包括:对所述第二异常用户网络中的各个节点的总影响力按照从大至小的顺序进行排序;选择总影响力在前k位的k个节点,获得k个关键异常用户,以形成关键异常用户的集合,其中,k的值为预先设定。
[0011]根据一些示例性实施例,所述针对所述第二异常用户网络中的每一个节点v,构造有向无环图,具体包括:计算所述第二异常用户网络中除节点v之外的其他节点对节点v的影响力;从所述其他节点中筛选出q个节点,其中,所述q个节点中每一个节点对节点v的影响力大于预先设定的影响力阈值,q为大于等于1的正整数,且q小于m2;根据节点v、q个节点和对应的边,构造所述节点v的有向无环图。
[0012]根据一些示例性实施例,所述方法还包括:分析所述第二异常用户网络,以获得所述第二异常用户网络的整体结构特征值和局部结构特征值;根据所述第二异常用户网络的整体结构特征值和局部结构特征值,确定所述第二异常用户网络的类型;根据所述第二异常用户网络的类型、整体结构特征值和局部结构特征值,确定所述第二异常用户网络的结构特征。
[0013]根据一些示例性实施例,所述第一异常用户网络的类型为无标度网络,所述第一异常用户网络的结构特征包括所述第一异常用户网络的节点的度的分布符合幂律分布,所述第二异常用户网络的结构特征包括所述第二异常用户网络的节点的度的分布符合幂律分布。
[0014]根据一些示例性实施例,所述第二异常用户网络的结构特征与所述第一异常用户
网络的结构特征一致包括:所述第二异常用户网络的节点的度的幂律分布中的幂指数与所述第一异常用户网络的节点的度的幂律分布中的幂指数的比值在0.8~1.2之间。
[0015]根据一些示例性实施例,所述调整所述度阈值和所述介数阈值包括:根据贝叶斯优化调参方法调整所述度阈值和所述介数阈值。
[0016]根据本专利技术的第二方面,还提供一种识别关键异常用户的装置,所述装置包括:第一异常用户网络获取模块,用于获取第一异常用户网络,其中,所述第一异常用户网络包括m1个节点和n1个边,各个节点表示各个异常用户,各个边表示各个异常用户之间的关联关系,m1、n1均为大于等于3的正整数;第一异常用户网络分析模块,用于分析所述第一异常用户网络,以获得所述第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别关键异常用户的方法,其特征在于,所述方法包括:获取第一异常用户网络,其中,所述第一异常用户网络包括m1个节点和n1个边,各个节点表示各个异常用户,各个边表示各个异常用户之间的关联关系,m1、n1均为大于等于3的正整数;分析所述第一异常用户网络,以获得所述第一异常用户网络的结构特征;从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,其中,所述第二异常用户网络包括m2个节点和n2个边,所述第二异常用户网络的结构特征与所述第一异常用户网络的结构特征一致,m2和n2均为大于等于2的正整数,m3和n3均为大于等于1的正整数,m2和m3均小于m1,n2和n3均小于n1;以及利用影响力最大化算法分析所述第二异常用户网络,以获得关键异常用户的集合,其中,所述关键异常用户的集合包括k个异常用户,所述k个异常用户为所述第二异常用户网络中的影响力从大至小排在前k位的节点,k为大于等于1的正整数,k小于m2。2.根据权利要求1所述的方法,其特征在于,所述分析所述第一异常用户网络,以获得所述第一异常用户网络的结构特征,具体包括:分析所述第一异常用户网络,以获得所述第一异常用户网络的整体结构特征值和局部结构特征值;根据所述第一异常用户网络的整体结构特征值和局部结构特征值,确定所述第一异常用户网络的类型;以及根据所述第一异常用户网络的类型、整体结构特征值和局部结构特征值,确定所述第一异常用户网络的结构特征。3.根据权利要求2所述的方法,其特征在于,所述第一异常用户网络的整体结构特征值包括所述第一异常用户网络的各个节点的度、各个边的介数、第一异常用户网络的聚类系数和平均路径长度;和/或,所述第一异常用户网络的局部结构特征值包括度相关性和介数相关性。4.根据权利要求3所述的方法,其特征在于,所述从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,具体包括:网络简化子步骤:根据所述第一异常用户网络的度分布和介数分布,确定度阈值和介数阈值;从所述第一异常用户网络中去除度小于所述度阈值的节点,以及,从所述第一异常用户网络中去除介数小于所述介数阈值的边,以获得中间异常用户网络。5.根据权利要求4所述的方法,其特征在于,所述从所述第一异常用户网络中去除m3个节点和n3个边,以获得第二异常用户网络,还具体包括:分析所述中间异常用户网络,以获得所述中间异常用户网络的结构特征;比较所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征;如果所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征不一致,调整所述度阈值和所述介数阈值,重复执行所述网络简化子步骤,直至所述中间异常用户网络的结构特征与所述第一异常用户网络的结构特征一致;以及将与所述第一异常用户网络的结构特征一致的中间异常用户网络作为所述第二异常用户网络。6.根据权利要求1

5中任一项所述的方法,其特征在于,所述利用影响力最大化算法分
析所述第二异常用户网络,以获得关键异常用户的集合,具体包括:针对所述第二异常用户网络中的每一个节点v,构造有向无环图,以获得m2个有向无环图,其中,每一个节点v分布在多个有向无环图中;在m2个有向无环图中的每一个有向无环图的范围内,分别计算各个节点在该有向无环图中的影响力;针对所述第二异常用户网络中的每一个节点v,获取该节点v在分布的多个有向无环图中的多个影响力,并叠加该节点v的所述多个影响力,以获得该节点v在所述第二异常用户网络中的总影响力。7.根据权利要求6所述的方法,其特征在于,所述利用影响力最大化算法分析所述第二异常用户网络,...

【专利技术属性】
技术研发人员:李沅坷金驰程佩哲许啸
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1