一种风险数据挖掘方法、装置以及设备制造方法及图纸

技术编号:26506829 阅读:20 留言:0更新日期:2020-11-27 15:34
本说明书实施例公开了一种风险数据挖掘方法、装置以及设备。方案包括:确定由多个用户节点和用户节点间的关联边构成的关系图谱,以及为用户节点生成分组标签;根据关系图谱和分组标签,确定多个用户节点总体的第一模块度指标;根据更新过的分组标签,确定多个用户节点总体的第二模块度指标,其中,第二模块度指标表示的模块结构强度高于第一模块度指标表示的模块结构强度;根据第二模块度指标及其对应的分组标签,确定风险用户节点组。

【技术实现步骤摘要】
一种风险数据挖掘方法、装置以及设备
本说明书涉及计算机软件
,尤其涉及一种风险数据挖掘方法、装置以及设备。
技术介绍
随着计算机技术和互联网的迅速发展,越来越多的业务都在互联网上进行,给人们的生活带来了极大的便利,但是,同时也带来了不少风险。典型的风险包括一些不法分子以互联网为媒介,以网络技术为主要手段的不法行为,比如,网络赌博、网络洗钱、病毒勒索、木马盗号等,这些风险威胁到计算机信息系统安全和网络空间管理秩序,甚至国家安全、社会稳定,将这样的不法分子称为黑产用户,黑产用户也经常团伙作案,将这样团伙称为黑产团伙。目前采用传统的机器学习聚类模型,通过无监督的聚类算法来尝试挖掘网络中诸如黑产团伙这类的风险用户团伙。但是,还需要能够更为有效挖掘风险用户团伙的方案。
技术实现思路
本说明书一个或多个实施例提供识别一种风险数据挖掘方法、装置、设备以及存储介质,用以解决如下技术问题:需要能够更为有效挖掘风险用户团伙的方案。为解决上述技术问题,本说明书一个或多个实施例是这样实现的:本说明书一个或多个实本文档来自技高网...

【技术保护点】
1.一种风险数据挖掘方法,包括:/n确定由多个用户节点和所述用户节点间的关联边构成的关系图谱,以及为所述用户节点生成分组标签;/n根据所述关系图谱和所述分组标签,确定所述多个用户节点总体的第一模块度指标;/n根据更新过的所述分组标签,确定所述多个用户节点总体的第二模块度指标,其中,所述第二模块度指标表示的模块结构强度高于所述第一模块度指标表示的模块结构强度;/n根据所述第二模块度指标及其对应的所述分组标签,确定风险用户节点组。/n

【技术特征摘要】
1.一种风险数据挖掘方法,包括:
确定由多个用户节点和所述用户节点间的关联边构成的关系图谱,以及为所述用户节点生成分组标签;
根据所述关系图谱和所述分组标签,确定所述多个用户节点总体的第一模块度指标;
根据更新过的所述分组标签,确定所述多个用户节点总体的第二模块度指标,其中,所述第二模块度指标表示的模块结构强度高于所述第一模块度指标表示的模块结构强度;
根据所述第二模块度指标及其对应的所述分组标签,确定风险用户节点组。


2.如权利要求1所述的方法,所述为所述用户节点生成分组标签,具体包括:
为所述用户节点生成初始化的分组标签;
根据所述用户节点在所述关系图谱中的附近节点,调整所述初始化的分组标签。


3.如权利要求2所述的方法,所述根据所述用户节点在所述关系图谱中的附近节点,调整所述初始化的分组标签,具体包括:
确定所述用户节点在所述关系图谱中的邻接节点;
将所述初始化的分组标签,调整为所述邻接节点的分组标签。


4.如权利要求1所述的方法,所述根据所述关系图谱和所述分组标签,确定所述多个用户节点总体的第一模块度指标,具体包括:
根据所述关系图谱,确定所述用户节点间的关联边的权重;
根据所述权重和所述分组标签,确定属于相同分组的所述用户节点的局部模块度指标;
根据所述局部模块度指标,确定所述多个用户节点总体的第一模块度指标。


5.如权利要求4所述的方法,所述根据所述权重和所述分组标签,确定属于相同分组的所述用户节点的局部模块度指标,具体包括:
根据所述分组标签,在所述多个用户节点中确定属于相同分组的第一节点和第二节点;
为至少一种节点组合确定对应的第一关注度参数,其中,所述节点组合根据所述第一节点、所述第二节点是否属于预定的风险节点集合划分得到;
根据所述权重、所述至少一种节点组合及其对应的所述第一关注度参数,确定属于相同分组的所述用户节点的局部模块度指标。


6.如权利要求1所述的方法,所述根据更新过的所述分组标签,确定所述多个用户节点总体的第二模块度指标,具体包括:
对所述分组标签进行一次或者多次更新,并对应地确定所述多个用户节点总体的第三模块度指标;
在所述第三模块度指标中,确定所述多个用户节点总体的第二模块度指标,其中,所述第二模块度指标表示的模块结构强度不低于所述第三模块度指标表示的模块结构强度。


7.如权利要求1所述的方法,所述根据更新过的所述分组标签,确定所述多个用户节点总体的第二模块度指标,具体包括:
遍历所述多个用户节点,通过更新遍历到的用户节点的分组标签,确定该用户节点对应的所述多个用户节点总体的第三模块度指标;
根据所述分组标签和所述第三模块度指标,通过迭代执行所述遍历的过程,确定所述多个用户节点总体的第二模块度指标。


8.如权利要求1所述的方法,所述根据所述第二模块度指标及其对应的所述分组标签,确定风险用户节点组,具体包括:
判断在所述分组标签的可更新范围内,对应确定出的所述第二模块度指标表示的模块结构强度是否已经达到最高;
若是,则根据所述第二模块度指标对应的所述分组标签,确定风险用户节点组。


9.如权利要求1所述的方法,所述确定风险用户节点组之后,所述方法还包括:
根据所述关系图谱,确定所述风险用户节点组中指定用户节点的邻接节点的关联边的权重;
根据所述权重,确定所述指定用户节点的中心度指标;
根据所述中心度指标,确定所述风险用户节点组中的核心用户节点。


10.如权利要求9所述的方法,所述根据所述权重,确定所述指定用户节点的中心度指标,具体包括:
确定所述邻接节点是否属于预定的风险用户节点集合,得到所述邻接节点对应的确定结果;
为所述确定结果确定对应的第二关注度参数;
根据所述权重和所述对应的第二关注度参数,确定所述指定用户节点的中心度指标。


11.如权利要求1~10任一项所述的方法,所述多个用户节点中包含具有网络风险的黑产用户节点;
所述确定风险用户节点组,具体包括:
确定反映黑产团伙的黑产用户节点组。


12.一种风险数据挖掘装置,包括:
初始化模块,确定由多个用户节点和所述用户节点间的关联边构成的关系图谱,以及为所述用户节点生成分组标签;

【专利技术属性】
技术研发人员:庞博凌芳觉
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1