网络训练方法、风险用户识别方法、装置、设备及介质制造方法及图纸

技术编号:28874040 阅读:10 留言:0更新日期:2021-06-15 23:08
本申请提供一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质,训练方法包括:获取多个低风险用户信息;对多个低风险用户信息进行向量编码,得到多个低风险用户向量;对多个低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵;基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,对预设的预训练网络进行训练,直至预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络。本实施例以基于低风险用户信息构建具有高风险特征的异常用户矩阵,从而实现构建风险特征提取网络的训练样本集,降低网络训练难度和提高网络训练准确度。

【技术实现步骤摘要】
网络训练方法、风险用户识别方法、装置、设备及介质
本申请涉及数据处理
,具体而言,涉及一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质。
技术介绍
随着互联网技术的快速发展,越来越多金融业务在线上渠道进行网络交易,但是网络交易伴随着网络金融诈骗风险,因此将风险识别作为网络金融业务安全性的重要保障手段,在网络诈骗犯罪预防中至关重要。目前,风险识别方法主要采用统计模型和机器学习模型来进行风险评估,比如支持向量机、随机森林、梯度提升决策树等。随着计算机算力的不断提升,深度学习网络也被应用于风险识别。风险识别的主要目的是识别出高风险用户,所以在网络训练时需要学习大量高风险用户数据的高风险特征。但是在项目资金众筹或贷款申请等实际应用场景中,大量用户属于按时还款、按时偿还项目借贷资金的低风险用户,可能发生骗贷事件的高风险用户非常少,使得网络训练极为困难。
技术实现思路
本申请实施例的目的在于提供一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质,旨在解决当前风险识别网络训练难度大的问题。第一方面,本申请实施例提供了一种网络训练方法,包括:获取训练样本信息,训练样本信息包括多个低风险用户信息;对多个低风险用户信息进行向量编码,得到多个低风险用户向量;对多个低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵;基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,对预设的预训练网络进行训练,直至预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络。在本实施例中,通过获取包括多个低风险用户信息的训练样本信息,对多个低风险用户信息进行向量编码,得到多个低风险用户向量,以及对多个低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,以基于低风险用户信息构建具有高风险特征的异常用户矩阵,从而实现构建风险特征提取网络的训练样本集,降低网络训练难度和提高网络训练准确度;最后基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,对预设的预训练网络进行训练,直至预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络,从而实现网络训练。在一实施例中,低风险用户信息包括数值型信息和类别型信息,对多个低风险用户信息进行向量编码,得到多个低风险用户向量,包括:对于每个低风险用户信息,对类别型信息进行独热编码,得到类别向量;若数值型信息为预设信息,则基于预设的数值确定函数,确定数值型信息的取值,得到数值向量;将类别向量与数值向量进行连接,得到低风险用户向量。在实现方式中,针对数值型信息为预设信息时,对数值型信息进行取值,提高对不同业务场景的针对性,使得不同业务场景下的用户信息进行差异性分析。在一实施例中,对多个低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,包括:从多个低风险用户向量中选取若干个第一用户向量,对第一用户向量进行向量拼接和向量替换,得到第一正常用户矩阵和第二正常用户矩阵;将第二用户向量中的数值向量替换预设数值向量,得到异常用户矩阵,第二用户向量为第二正常用户矩阵中的一个或多个第一用户向量。在本实现方式中,通过向量拼接和向量替换构建正常用户矩阵,再将第二正常用户矩阵中的数值向量替换为预设数值向量,使得低风险用户信息的正常数值被变更为异常数值,从而使得低风险用户信息变为高风险用户信息,实现高风险用户矩阵的构建。进一步地,低风险用户向量的数量为M个,从多个低风险用户向量中选取若干个第一用户向量,对第一用户向量进行向量拼接和向量替换,得到第一正常用户矩阵和第二正常用户矩阵,包括:从M个低风险用户向量中选取m个第一用户向量,对m个第一用户向量进行向量拼接,得到第一正常用户矩阵;从M-m个低风险用户向量中选取1个第三用户向量;将第一正常用户矩阵中的1个第一用户向量替换为第三用户向量,得到第二正常用户矩阵。在本实现方式中,通过向量拼接构建第一正常用户矩阵,以及通过向量替换构建第二正常用户矩阵,以便于网络学习低风险用户信息的风险特征,以及学习低风险用户信息与高风险用户信息之间的风险特征差异,从而提高网络的学习精度。在一实施例中,基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,对预设的预训练网络进行训练,直至预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络,包括:基于预训练网络,提取第一正常用户矩阵的第一特征向量、第二正常用户矩阵的第二特征向量和异常用户矩阵的第三特征向量;确定第一特征向量与第二特征向量之间的第一特征距离,以及第一特征向量与第三特征向量之间的第二特征距离;基于第一特征距离和第二特征距离,确定损失函数的损失值;基于损失值,更新预训练网络的网络参数,直至损失函数达到预设收敛条件,得到风险用户提取网络。在本实现方式中,通过特征距离构建损失函数,以实现训练风险特征提取网络,解决相关网络训练难度大的问题。进一步地,损失函数的计算公式为:其中loss为损失函数的损失值,为第一特征距离,为第二特征距离,为预设的超参数。在本实施例中,通过低风险用户特征与低风险用户特征之间的第一特征距离,以及低风险用户特征与高风险用户特征之间的第二特征距离,使得网络能够学习到不同风险用户特征之间的特征信息,实现网络训练。第二方面,本申请实施例提供了一种风险用户识别方法,包括:对待识别的目标用户信息进行向量编码,得到目标用户向量;基于目标用户向量和多个预设用户向量,构建参考矩阵和目标矩阵,目标矩阵包括目标用户向量;基于预设的风险特征提取网络,提取参考矩阵的第四特征向量和目标矩阵的第五特征向量,风险特征提取网络基于上述训练方法训练得到;基于第四特征向量与第五特征向量之间的第三特征距离,确定目标用户信息的风险状态。在本实施中,通过基于目标用户向量和多个预设用户向量,构建参考矩阵和目标矩阵,再利用第一方面的训练方法训练得到的风险特征提取参考矩阵的第四特征向量和目标矩阵的第五特征向量,以及基于第四特征向量与第五特征向量之间的第三特征距离,确定目标用户信息的风险状态,实现目标用户信息的风险识别。在一实施例中,目标用户信息包括类别型信息和数值型信息,对待识别的目标用户信息进行向量编码,得到目标用户向量,包括:对于每个目标用户信息,对类别型信息进行独热编码,得到类别向量;若数值型信息为预设信息,则基于预设的数值确定函数,确定数值型信息的取值,得到数值向量;将类别向量与数值向量进行连接,得到目标用户向量。在本实现方式中,针对数值型信息为预设信息时,对数值型信息进行取值,提高对不同业务场景的针对性,使得不同业务场景下的用户信息进行差异性分析。在一实施例中,基于目标用户向量和多个预设用户向量,构建参考矩阵本文档来自技高网...

【技术保护点】
1.一种网络训练方法,其特征在于,包括:/n获取训练样本信息,所述训练样本信息包括多个低风险用户信息;/n对多个所述低风险用户信息进行向量编码,得到多个低风险用户向量;/n对多个所述低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵;/n基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵,对预设的预训练网络进行训练,直至所述预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络。/n

【技术特征摘要】
1.一种网络训练方法,其特征在于,包括:
获取训练样本信息,所述训练样本信息包括多个低风险用户信息;
对多个所述低风险用户信息进行向量编码,得到多个低风险用户向量;
对多个所述低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵;
基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵,对预设的预训练网络进行训练,直至所述预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络。


2.根据权利要求1所述的网络训练方法,其特征在于,所述低风险用户信息包括数值型信息和类别型信息,所述对多个所述低风险用户信息进行向量编码,得到多个低风险用户向量,包括:
对于每个所述低风险用户信息,对所述类别型信息进行独热编码,得到类别向量;
若所述数值型信息为预设信息,则基于预设的数值确定函数,确定所述数值型信息的取值,得到数值向量;
将所述类别向量与所述数值向量进行连接,得到所述低风险用户向量。


3.根据权利要求1所述的网络训练方法,其特征在于,所述对多个所述低风险用户向量进行向量拼接和向量替换,构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵,包括:
从多个所述低风险用户向量中选取若干个第一用户向量,对所述第一用户向量进行向量拼接和向量替换,得到所述第一正常用户矩阵和所述第二正常用户矩阵;
将第二用户向量中的数值向量替换预设数值向量,得到所述异常用户矩阵,所述第二用户向量为所述第二正常用户矩阵中的一个或多个所述第一用户向量。


4.根据权利要求3所述的网络训练方法,其特征在于,所述低风险用户向量的数量为M个,所述从多个所述低风险用户向量中选取若干个第一用户向量,对所述第一用户向量进行向量拼接和向量替换,得到所述第一正常用户矩阵和所述第二正常用户矩阵,包括:
从M个所述低风险用户向量中选取m个所述第一用户向量,对m个所述第一用户向量进行向量拼接,得到所述第一正常用户矩阵;
从M-m个所述低风险用户向量中选取1个第三用户向量;
将所述第一正常用户矩阵中的1个所述第一用户向量替换为所述第三用户向量,得到所述第二正常用户矩阵。


5.根据权利要求1所述的网络训练方法,其特征在于,所述基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵,对预设的预训练网络进行训练,直至所述预训练网络的损失函数达到预设收敛条件,得到风险特征提取网络,包括:
基于所述预训练网络,提取所述第一正常用户矩阵的第一特征向量、所述第二正常用户矩阵的第二特征向量和所述异常用户矩阵的第三特征向量;
确定所述第一特征向量与所述第二特征向量之间的第一特征距离,以及所述第一特征向量与所述第三特征向量之间的第二特征距离;
基于所述第一特征距离和所述第二特征距离,确定所述损失函数的损失值;
基于所述损失值,更新所述预训练网络的网络参数,直至所述损失函数达到所述预设收敛条件,得到所述风险用户提取网络。


6.根据权利要求5所述的网络训练方法,其特征在于,所述损失函数的计算公式为:



其中loss为所述损失函数的损失值,为所述第一特征距离,为所述第二特征距离,为预设的超参数。


7.一种风险用户识别方法,其特征在于,包括:
对待识别的目标用户信息进行向量编码,得到目标用户向量;
基于所述目标用户向量和多个预设用户向量,构建参考矩阵和目标矩阵,所述目标矩阵包括所述目标用户向量;
基于预设的风险特征提取网络,提取所述参考矩阵的第四特征...

【专利技术属性】
技术研发人员:张翼温佳豪尤鸣宇韩煊
申请(专利权)人:北京轻松筹信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1