一种网络群体的发现方法、装置、设备及存储介质制造方法及图纸

技术编号:37399701 阅读:20 留言:0更新日期:2023-04-30 09:27
本公开提供了一种网络群体的发现方法、装置、设备及存储介质,通过将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据;由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵;将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,其中,所述节点分类模型为基于图卷积神经网络和标签传播算法相结合的神经网络模型,能够通过LPA增强拓扑图中节点间的属性,再结合GCN协同训练更新参数值,以提高模型预测的准确率,以及提高模型的鲁棒性并防止模型过平滑现象。提高模型的鲁棒性并防止模型过平滑现象。提高模型的鲁棒性并防止模型过平滑现象。

【技术实现步骤摘要】
一种网络群体的发现方法、装置、设备及存储介质


[0001]本公开涉及计算机领域的网络安全领域,尤其涉及一种网络群体的发现方法、装置、设备及存储介质。

技术介绍

[0002]在线欺诈已具备规模化特点,且已经将金融行业被列为攻击的重要目标。在线欺诈表面上看起来是一个真实存在的人,可以具有分散的IP、分散的设备、无关联手机号、有真实的朋友圈社交关系、有真实信用信息和真实地址等,但实际上,这很可能是黑灰产团队后端业务系统伪造出来的虚假人员信息。
[0003]现有的风控反欺诈大多数是人工审核以及以专家规则为标准,但是银行交易流水错综复杂,并且每日交易量在百万甚至千万级别,这不仅增加了工作人员的压力,而且审核效率低、漏检概率也高。除此之外,现有技术也存在一些经典机器学习算法来检测在线欺诈的虚拟人员,虽然提高了对黑产用户的挖掘能力,也相对提高了检测效率,但由于机器学习以处理小数据量为主,面对海量数据还是存在检测效率低、挖掘潜在黑产用户能力有限等缺陷。

技术实现思路

[0004]本公开提供了一种网络群体的发现方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。
[0005]根据本公开的第一方面,提供了一种网络群体的发现方法,其特征在于,所述方法包括:将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据;其中,所述原始数据为银行在预设时间段内的用户账号与其对应的交易数据;由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵,其中,所述节点属性矩阵包括各个用户账号根据自身的交易数据所生成的多个节点属性;所述邻接矩阵为各个用户账号与其关联的对手用户账号;所述特定标签数据为具有特定属性的用户账号及其标签信息;将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,其中,所述节点分类模型为基于图卷积神经网络和标签传播算法相结合的神经网络模型。
[0006]在一可实施方式中,所述将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据,包括:将所述原始数据进行编码和分割,得到整理后的原始数据;根据预设过滤规则对所述整理后的原始数据进行筛选,得到待处理数据,其中,所述预设过滤规则包括所述交易数据的缺失值和白名单关键字段。在一可实施方式中,所述由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵,包括:
将所述待处理数据和特定标签数据中的各个用户账号和其关联的对手用户账号作为节点,各个用户账号和其关联的对手用户账号的相连关系作为边,来构建所述邻接矩阵;根据所述待处理数据和特定标签数据中的各个用户账号与其对应的交易数据,构建各个用户账号的属性与属性值,并组成用户账号的节点属性矩阵。
[0007]在一可实施方式中,所述将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,包括:通过所述节点分类模型内的标签传播算法学习所述邻接矩阵内带有初始标签信息的各个节点与其相邻节点的无标签信息的影响力,以确定所述各个节点的边权重;其中,所述初始标签信息为所述特定标签数据内所包含的标签信息;通过所述各个节点的边权重优化所述邻接矩阵,形成新的邻接矩阵;将所述新的邻接矩阵输入所述节点分类模型内的图卷积神经网络,以预测所述待处理数据内各个节点的标签信息,作为所述待处理数据内各个用户账号的预测标签信息。
[0008]在一可实施方式中,在所述将原始数据进行预处理,得到待处理数据之前,还包括:获取训练数据,其中,所述训练数据包括:邻接矩阵数据、特定标签数据以及节点属性矩阵数据,其中,所述特定标签数据包括黑名单账号及其标签信息;根据所述训练数据,训练初始的节点分类模型,并通过标签传播损失函数和图卷积损失函数调节所述节点分类模型的参数。
[0009]根据本公开的第二方面,提供了一种网络群体的发现装置,所述装置包括:数据获取模块,用于将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据;其中,所述原始数据为银行在预设时间段内的用户账号与其对应的交易数据;构建模块,由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵,其中,所述节点属性矩阵包括各个用户账号根据自身的交易数据所生成的多个节点属性;所述邻接矩阵为各个用户账号与其关联的对手用户账号;所述特定标签数据为具有特定属性的用户账号及其标签信息;节点分类模块,将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,其中,所述节点分类模型为基于图卷积神经网络和标签传播算法相结合的神经网络模型。
[0010]在一可实施方式中,所述数据获取模块,具体用于:将所述原始数据进行编码和分割,得到整理后的原始数据;根据预设过滤规则对所述整理后的原始数据进行筛选,得到待处理数据,其中,所述预设过滤规则包括所述交易数据的缺失值和白名单关键字段。在一可实施方式中,所述构建模块,具体用于:将所述待处理数据和特定标签数据中的各个用户账号和其关联的对手用户账号作为节点,各个用户账号和其关联的对手用户账号的相连关系作为边,来构建所述邻接矩阵;根据所述待处理数据和特定标签数据中的各个用户账号与其对应的交易数据,构建各个用户账号的属性与属性值,并组成用户账号的节点属性矩阵。
[0011]在一可实施方式中,所述节点分类模块,具体用于:通过所述节点分类模型内的标签传播算法学习所述邻接矩阵内带有初始标签信息的各个节点与其相邻节点的无标签信息的影响力,以确定所述各个节点的边权重;其中,所述初始标签信息为所述特定标签数据内所包含的标签信息;通过所述各个节点的边权重优化所述邻接矩阵,形成新的邻接矩阵;将所述新的邻接矩阵输入所述节点分类模型内的图卷积神经网络,以预测所述待处理数据内各个节点的标签信息,作为所述待处理数据内各个用户账号的预测标签信息。在一可实施方式中,还包括:模型训练模块,用于获取训练数据,其中,所述训练数据包括:邻接矩阵数据、特定标签数据以及节点属性矩阵数据,其中,所述特定标签数据包括黑名单账号及其标签信息;根据所述训练数据,训练初始的节点分类模型,并通过标签传播损失函数和图卷积损失函数调节所述节点分类模型的参数。
[0012]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
[0013]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
[0014]本公开的网络群体的发现方法、装置、设备及存储介质,通过将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据;由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵;将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,其中,所述节点分类模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络群体的发现方法,其特征在于,所述方法包括:将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据;其中,所述原始数据为银行在预设时间段内的用户账号与其对应的交易数据;由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵,其中,所述节点属性矩阵包括各个用户账号根据自身的交易数据所生成的多个节点属性;所述邻接矩阵为各个用户账号与其关联的对手用户账号;所述特定标签数据为具有特定属性的用户账号及其标签信息;将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,其中,所述节点分类模型为基于图卷积神经网络和标签传播算法相结合的神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据,包括:将所述原始数据进行编码和分割,得到整理后的原始数据;根据预设过滤规则对所述整理后的原始数据进行筛选,得到待处理数据,其中,所述预设过滤规则包括所述交易数据的缺失值和白名单关键字段。3.根据权利要求2所述的方法,其特征在于,所述由所述待处理数据和特定标签数据构建邻接矩阵和节点属性矩阵,包括:将所述待处理数据和特定标签数据中的各个用户账号和其关联的对手用户账号作为节点,各个用户账号和其关联的对手用户账号的相连关系作为边,来构建所述邻接矩阵;根据所述待处理数据和特定标签数据中的各个用户账号与其对应的交易数据,构建各个用户账号的属性与属性值,并组成用户账号的节点属性矩阵。4.根据权利要求3所述的方法,其特征在于,所述将所述邻接矩阵和所述节点属性矩阵输入节点分类模型,得到所述待处理数据内各个用户账号的预测标签信息,包括:通过所述节点分类模型内的标签传播算法学习所述邻接矩阵内带有初始标签信息的各个节点与其相邻节点的无标签信息的影响力,以确定所述各个节点的边权重;其中,所述初始标签信息为所述特定标签数据内所包含的标签信息;通过所述各个节点的边权重优化所述邻接矩阵,形成新的邻接矩阵;将所述新的邻接矩阵输入所述节点分类模型内的图卷积神经网络,以预测所述待处理数据内各个节点的标签信息,作为所述待处理数据内各个用户账号的预测标签信息。5.根据权利要求1所述的方法,其特征在于,在所述将原始数据进行预处理,得到满足输入节点分类模型条件的待处理数据之...

【专利技术属性】
技术研发人员:栗位勋孙悦蔡准郭晓鹏
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1