网络训练方法、风险用户识别方法、装置、设备及介质制造方法及图纸

技术编号：28874040 阅读：10 留言：0更新日期：2021-06-15 23:08

本申请提供一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质，训练方法包括：获取多个低风险用户信息；对多个低风险用户信息进行向量编码，得到多个低风险用户向量；对多个低风险用户向量进行向量拼接和向量替换，构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵；基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵，对预设的预训练网络进行训练，直至预训练网络的损失函数达到预设收敛条件，得到风险特征提取网络。本实施例以基于低风险用户信息构建具有高风险特征的异常用户矩阵，从而实现构建风险特征提取网络的训练样本集，降低网络训练难度和提高网络训练准确度。

全部详细技术资料下载

【技术实现步骤摘要】
网络训练方法、风险用户识别方法、装置、设备及介质
本申请涉及数据处理
，具体而言，涉及一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质。
技术介绍
随着互联网技术的快速发展，越来越多金融业务在线上渠道进行网络交易，但是网络交易伴随着网络金融诈骗风险，因此将风险识别作为网络金融业务安全性的重要保障手段，在网络诈骗犯罪预防中至关重要。目前，风险识别方法主要采用统计模型和机器学习模型来进行风险评估，比如支持向量机、随机森林、梯度提升决策树等。随着计算机算力的不断提升，深度学习网络也被应用于风险识别。风险识别的主要目的是识别出高风险用户，所以在网络训练时需要学习大量高风险用户数据的高风险特征。但是在项目资金众筹或贷款申请等实际应用场景中，大量用户属于按时还款、按时偿还项目借贷资金的低风险用户，可能发生骗贷事件的高风险用户非常少，使得网络训练极为困难。
技术实现思路
本申请实施例的目的在于提供一种网络训练方法、风险用户识别方法、装置、电子设备及存储介质，旨在解决当前风险识别网络训练难度大的问题。第一方面，本申请实施例提供了一种网络训练方法，包括：获取训练样本信息，训练样本信息包括多个低风险用户信息；对多个低风险用户信息进行向量编码，得到多个低风险用户向量；对多个低风险用户向量进行向量拼接和向量替换，构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵；基于第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵，对预设的预训练网络进行训练，直至预训练...

【技术保护点】
1.一种网络训练方法，其特征在于，包括：/n获取训练样本信息，所述训练样本信息包括多个低风险用户信息；/n对多个所述低风险用户信息进行向量编码，得到多个低风险用户向量；/n对多个所述低风险用户向量进行向量拼接和向量替换，构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵；/n基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵，对预设的预训练网络进行训练，直至所述预训练网络的损失函数达到预设收敛条件，得到风险特征提取网络。/n

【技术特征摘要】
1.一种网络训练方法，其特征在于，包括：
获取训练样本信息，所述训练样本信息包括多个低风险用户信息；
对多个所述低风险用户信息进行向量编码，得到多个低风险用户向量；
对多个所述低风险用户向量进行向量拼接和向量替换，构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵；
基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵，对预设的预训练网络进行训练，直至所述预训练网络的损失函数达到预设收敛条件，得到风险特征提取网络。

2.根据权利要求1所述的网络训练方法，其特征在于，所述低风险用户信息包括数值型信息和类别型信息，所述对多个所述低风险用户信息进行向量编码，得到多个低风险用户向量，包括：
对于每个所述低风险用户信息，对所述类别型信息进行独热编码，得到类别向量；
若所述数值型信息为预设信息，则基于预设的数值确定函数，确定所述数值型信息的取值，得到数值向量；
将所述类别向量与所述数值向量进行连接，得到所述低风险用户向量。

3.根据权利要求1所述的网络训练方法，其特征在于，所述对多个所述低风险用户向量进行向量拼接和向量替换，构建第一正常用户矩阵、第二正常用户矩阵和异常用户矩阵，包括：
从多个所述低风险用户向量中选取若干个第一用户向量，对所述第一用户向量进行向量拼接和向量替换，得到所述第一正常用户矩阵和所述第二正常用户矩阵；
将第二用户向量中的数值向量替换预设数值向量，得到所述异常用户矩阵，所述第二用户向量为所述第二正常用户矩阵中的一个或多个所述第一用户向量。

4.根据权利要求3所述的网络训练方法，其特征在于，所述低风险用户向量的数量为M个，所述从多个所述低风险用户向量中选取若干个第一用户向量，对所述第一用户向量进行向量拼接和向量替换，得到所述第一正常用户矩阵和所述第二正常用户矩阵，包括：
从M个所述低风险用户向量中选取m个所述第一用户向量，对m个所述第一用户向量进行向量拼接，得到所述第一正常用户矩阵；
从M-m个所述低风险用户向量中选取1个第三用户向量；
将所述第一正常用户矩阵中的1个所述第一用户向量替换为所述第三用户向量，得到所述第二正常用户矩阵。

5.根据权利要求1所述的网络训练方法，其特征在于，所述基于所述第一正常用户矩阵、所述第二正常用户矩阵和所述异常用户矩阵，对预设的预训练网络进行训练，直至所述预训练网络的损失函数达到预设收敛条件，得到风险特征提取网络，包括：
基于所述预训练网络，提取所述第一正常用户矩阵的第一特征向量、所述第二正常用户矩阵的第二特征向量和所述异常用户矩阵的第三特征向量；
确定所述第一特征向量与所述第二特征向量之间的第一特征距离，以及所述第一特征向量与所述第三特征向量之间的第二特征距离；
基于所述第一特征距离和所述第二特征距离，确定所述损失函数的损失值；
基于所述损失值，更新所述预训练网络的网络参数，直至所述损失函数达到所述预设收敛条件，得到所述风险用户提取网络。

6.根据权利要求5所述的网络训练方法，其特征在于，所述损失函数的计算公式为：

其中loss为所述损失函数的损失值，为所述第一特征距离，为所述第二特征距离，为预设的超参数。

7.一种风险用户识别方法，其特征在于，包括：
对待识别的目标用户信息进行向量编码，得到目标用户向量；
基于所述目标用户向量和多个预设用户向量，构建参考矩阵和目标矩阵，所述目标矩阵包括所述目标用户向量；
基于预设的风险特征提取网络，提取所述参考矩阵的第四特征...

【专利技术属性】
技术研发人员：张翼，温佳豪，尤鸣宇，韩煊，
申请(专利权)人：北京轻松筹信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人