风险识别方法、装置和电子设备制造方法及图纸

技术编号:31585503 阅读:17 留言:0更新日期:2021-12-25 11:30
本说明书实施例提出了一种风险识别方法、装置和电子设备,其中,上述风险识别方法中,端设备利用本地的训练数据对本地模型进行一轮训练之后,将训练获得的模型参数的梯度加密之后,根据上述端设备对应的梯度比例上传给中央服务器,然后中央服务器将每个端设备上传的梯度进行聚合,使用聚合后的梯度更新模型参数,再根据第一参数,确定向每个端设备下发模型参数的参数比例,最后,按照上述参数比例,将更新后的模型参数下发给至少两个端设备,以供至少两个端设备进行本地模型的更新,从而可以保证在梯度上传的过程中,中央服务器更注意那些效果更差的模型,也可以保证全局模型的效果不会偏向过好或过差的局部模型,提升了全局模型的效果。效果。效果。

【技术实现步骤摘要】
风险识别方法、装置和电子设备


[0001]本说明书实施例涉及互联网
,尤其涉及一种风险识别方法、装置和电子设备。

技术介绍

[0002]随着时代的发展,移动支付在生活中越来越普遍,用户在不同的设备(手机或移动穿戴设备等)上都可以完成在线支付。然而,随之而来的支付风险也与以往不同,为了能够更好地刻画用户交易时的风险画像并对交易进行实时风险识别,引入用户在客户端的行为数据是有很大增益的。但是用户客户端的数据,往往涉及到隐私保护问题,不能够实时传回云端服务器进行建模分析,因此需要借助联邦学习的思想,完成数据在不出设备的情况下,参与风险识别模型的训练。常规的联邦学习会对不同设备上的数据进行拟合,联合训练一套模型参数用于所有设备。
[0003]然而,通常情况下,为了覆盖更多的用户,联邦学习网络中的端设备数量很大,从数百个到数百万个不等,甚至涉及上亿个设备。同时,不同设备上的数据是不均衡的,特征、分布和/或量级都有所不同,每个设备上的数据属于非独立同分布,如果在联邦建模时对设备数据只是简单的拟合,很容易造成拟合的模型只适用于一部分设备采集的端数据,对于另一部分设备的效果很差,这就造成了联邦学习网络的不公平性。在风控场景中,会导致对一部分用户设备上的交易风险识别较准确,但对另一部分用户设备上的交易风险识别准确率较差,从而造成风险漏过或误拦截的问题,造成一定程度上的资损和/或用户账户不安全等问题。

技术实现思路

[0004]本说明书实施例提供了一种风险识别方法、装置和电子设备,以实现对于全局设备来说模型效果最优,并且对于端设备来说模型效果相对最优,在风控场景中,避免了因端设备本身的差异以及端设备数据的差异引起的端设备的模型效果的不同,提升了全局及局部端设备的模型效果,从而防止了在个别端设备上风险误识别的情况。
[0005]第一方面,本说明书实施例提供一种风险识别方法,包括:中央服务器获取至少两个端设备上传的梯度;其中,所述梯度是所述端设备利用本地的训练数据对本地模型进行一轮训练,将训练获得的模型参数的梯度加密之后,根据所述端设备对应的梯度比例上传的;所述端设备对应的梯度比例根据所述中央服务器发送的第一参数确定;将每个端设备上传的梯度进行聚合,使用聚合后的梯度更新模型参数;根据所述第一参数,确定向每个端设备下发模型参数的参数比例;按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新。
[0006]上述风险识别方法中,端设备利用本地的训练数据对本地模型进行一轮训练之后,将训练获得的模型参数的梯度加密之后,根据上述端设备对应的梯度比例上传给中央服务器,然后中央服务器将每个端设备上传的梯度进行聚合,使用聚合后的梯度更新模型
参数,再根据第一参数,确定向每个端设备下发模型参数的参数比例,最后,按照上述参数比例,将更新后的模型参数下发给至少两个端设备,以供至少两个端设备利用下发的模型参数进行本地模型的更新,从而可以保证在梯度上传的过程中,中央服务器更注意那些效果更差的模型,也可以保证全局模型的效果不会偏向过好或过差的局部模型,避免了联邦学习网络的不公平的问题,提升了全局模型的效果,这样在风控场景中可以提升全局风险识别的准确率。
[0007]其中一种可能的实现方式中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:在最终轮的训练结束之后,将最终轮训练获得的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用最终轮训练获得的模型参数进行本地模型的更新,获得训练好的本地模型,并利用训练好的本地模型对所述端设备上进行的交易进行风险识别。
[0008]其中一种可能的实现方式中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:接收所述至少两个端设备上传的所述至少两个端设备的本地模型的准确率;其中,所述至少两个端设备的本地模型的准确率是所述至少两个端设备分别利用本地的验证数据计算的;根据所述至少两个端设备的本地模型的准确率计算全局平均准确率,以及根据所述至少两个端设备的本地模型的准确率计算方差;根据所述全局平均准确率和所述方差确定停止训练。
[0009]其中一种可能的实现方式中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:根据所述至少两个端设备上传的梯度,调整下一轮训练中第一参数的值;将调整后的第一参数发送给所述至少两个端设备中的每个端设备。
[0010]其中一种可能的实现方式中,所述端设备并行训练至少两个本地模型,在利用所述中央服务器下发的模型参数对所述至少两个本地模型进行更新之后,所述端设备利用本地的验证数据验证所述至少两个本地模型的准确率,根据所述准确率选择所述端设备进行风险识别的本地模型。
[0011]第二方面,本说明书实施例提供一种风险识别装置,设置在中央服务器中,所述风险识别装置包括:获取模块,用于获取至少两个端设备上传的梯度;其中,所述梯度是所述端设备利用本地的训练数据对本地模型进行一轮训练,将训练获得的模型参数的梯度加密之后,根据所述端设备对应的梯度比例上传的;所述端设备对应的梯度比例根据所述中央服务器发送的第一参数确定;聚合模块,用于将每个端设备上传的梯度进行聚合;更新模块,用于使用所述聚合模块聚合后的梯度更新模型参数;确定模块,用于根据所述第一参数,确定向每个端设备下发模型参数的参数比例;发送模块,用于按照所述确定模块确定的参数比例,将所述更新模块更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新。
[0012]其中一种可能的实现方式中,所述装置还包括:所述发送模块,还用于在将所述更新模块更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,在最终轮的训练结束之后,将最终轮训练获得的模
型参数下发给所述至少两个端设备,以供所述至少两个端设备利用最终轮训练获得的模型参数进行本地模型的更新,获得训练好的本地模型,并利用训练好的本地模型对所述端设备上进行的交易进行风险识别。
[0013]其中一种可能的实现方式中,所述装置还包括:接收模块和计算模块;所述接收模块,用于在所述发送模块将所述更新模块更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,接收所述至少两个端设备上传的所述至少两个端设备的本地模型的准确率;其中,所述至少两个端设备的本地模型的准确率是所述至少两个端设备分别利用本地的验证数据计算的;所述计算模块,用于根据所述至少两个端设备的本地模型的准确率计算全局平均准确率,以及根据所述至少两个端设备的本地模型的准确率计算方差;所述确定模块,还用于根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险识别方法,包括:中央服务器获取至少两个端设备上传的梯度;其中,所述梯度是所述端设备利用本地的训练数据对本地模型进行一轮训练,将训练获得的模型参数的梯度加密之后,根据所述端设备对应的梯度比例上传的;所述端设备对应的梯度比例根据所述中央服务器发送的第一参数确定;将每个端设备上传的梯度进行聚合,使用聚合后的梯度更新模型参数;根据所述第一参数,确定向每个端设备下发模型参数的参数比例;按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新。2.根据权利要求1所述的方法,其中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:在最终轮的训练结束之后,将最终轮训练获得的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用最终轮训练获得的模型参数进行本地模型的更新,获得训练好的本地模型,并利用训练好的本地模型对所述端设备上进行的交易进行风险识别。3.根据权利要求1所述的方法,其中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:接收所述至少两个端设备上传的所述至少两个端设备的本地模型的准确率;其中,所述至少两个端设备的本地模型的准确率是所述至少两个端设备分别利用本地的验证数据计算的;根据所述至少两个端设备的本地模型的准确率计算全局平均准确率,以及根据所述至少两个端设备的本地模型的准确率计算方差;根据所述全局平均准确率和所述方差确定停止训练。4.根据权利要求1所述的方法,其中,所述按照所述参数比例,将更新后的模型参数下发给所述至少两个端设备,以供所述至少两个端设备利用下发的模型参数进行本地模型的更新之后,还包括:根据所述至少两个端设备上传的梯度,调整下一轮训练中第一参数的值;将调整后的第一参数发送给所述至少两个端设备中的每个端设备。5.根据权利要求2

4任意一项所述的方法,其中,所述端设备并行训练至少两个本地模型,在利用所述中央服务器下发的模型参数对所述至少两个本地模型进行更新之后,所述端设备利用本地的验证数据验证所述至少两个本地模型的准确率,根据所述准确率选择所述端设备进行风险识别的本地模型。6.一种风险识别装置,设置在中央服务器中,所述风险识别装置包括:获取模块,用于获取至少两个端设备上传的梯度;其中,所述梯度是所述端设备利用本地的训练数据对本地模型进行一轮训练,将...

【专利技术属性】
技术研发人员:林晓彤许辽萨
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1