【技术实现步骤摘要】
基于多方安全计算的树模型的训练方法和业务预测方法
本公开涉及机器学习技术,具体涉及一种基于多方安全计算的树模型的训练方法和业务预测方法。
技术介绍
多方安全计算(SecureMulti-PartyComputation,MPC)是针对无可信第三方情况下,安全地进行多方协同的计算问题。即在一个分布式网络中,多个参与实体各自持有秘密输入,各方希望共同完成对某函数的计算,而要求每个参与实体除计算结果外均不能得到其他参与实体的任何输入信息。相关技术中,可以使用MPC的方法由多方共同训练模型,每个参与方都具有训练模型所需的一部分样本特征。参与MPC计算的多方通常只有其中一个主体方拥有自己的样本标签,其他的参与方只是提供自己的特征协助训练模型。
技术实现思路
本公开实施例至少提供一种基于多方安全计算的树模型的训练方法和业务预测方法。第一方面,提供一种基于多方安全计算的树模型的训练方法,所述树模型由参与多方安全计算的多方共同训练,所述多方包括第一数据拥有方和至少一个第二数据拥有方,其中,第一数据拥有方具有各训练样本对应的第一样本标签,所述第二数据拥有方具有训练样本对应的第二样本标签;所述方法包括:所述第一数据拥有方接收所述第二数据拥有方发送的每个训练样本分别对应的第二加密中间参数,其中,所述第二加密中间参数是由第二数据拥有方根据所述第二样本标签获得第二中间参数后再进行同态加密得到;基于本轮迭代对应的分裂特征,将各训练样本划分得到样本集合;将所述样本集合中所有样本的第二加密中间参数 ...
【技术保护点】
1.一种基于多方安全计算的树模型的训练方法,其特征在于,所述树模型由参与多方安全计算的多方共同训练,所述多方包括第一数据拥有方和至少一个第二数据拥有方,其中,所述第一数据拥有方具有各训练样本对应的第一样本标签,所述第二数据拥有方具有所述训练样本对应的第二样本标签;/n所述方法包括:/n所述第一数据拥有方接收所述第二数据拥有方发送的每个训练样本分别对应的第二加密中间参数,其中,所述第二加密中间参数是由第二数据拥有方根据所述第二样本标签获得第二中间参数后再进行同态加密得到;/n基于本轮迭代对应的分裂特征,将各训练样本划分得到样本集合;/n将所述样本集合中所有样本的第二加密中间参数统计后返回至第二数据拥有方,以使得所述第二数据拥有方解密得到第二中间参数统计值;/n对于每个训练样本,根据所述第一样本标签获得第一中间参数,并统计所述样本集合中所有样本的第一中间参数统计值;/n基于中间参数,调整所述树模型的模型参数,其中,所述中间参数是根据所述第一中间参数统计值、以及第二中间参数统计值得到。/n
【技术特征摘要】
1.一种基于多方安全计算的树模型的训练方法,其特征在于,所述树模型由参与多方安全计算的多方共同训练,所述多方包括第一数据拥有方和至少一个第二数据拥有方,其中,所述第一数据拥有方具有各训练样本对应的第一样本标签,所述第二数据拥有方具有所述训练样本对应的第二样本标签;
所述方法包括:
所述第一数据拥有方接收所述第二数据拥有方发送的每个训练样本分别对应的第二加密中间参数,其中,所述第二加密中间参数是由第二数据拥有方根据所述第二样本标签获得第二中间参数后再进行同态加密得到;
基于本轮迭代对应的分裂特征,将各训练样本划分得到样本集合;
将所述样本集合中所有样本的第二加密中间参数统计后返回至第二数据拥有方,以使得所述第二数据拥有方解密得到第二中间参数统计值;
对于每个训练样本,根据所述第一样本标签获得第一中间参数,并统计所述样本集合中所有样本的第一中间参数统计值;
基于中间参数,调整所述树模型的模型参数,其中,所述中间参数是根据所述第一中间参数统计值、以及第二中间参数统计值得到。
2.根据权利要求1所述的方法,其特征在于,所述基于中间参数,调整所述树模型的模型参数,其中,所述中间参数是根据所述第一中间参数统计值、以及第二中间参数统计值得到,包括:
对所述第一中间参数统计值、以及第二中间参数统计值,以各自的权重系数进行加权平均,得到所述中间参数。
3.根据权利要求1所述的方法,其特征在于,所述基于中间参数,调整所述树模型的模型参数,其中,所述中间参数是根据所述第一中间参数统计值、以及第二中间参数统计值得到,包括:
当所述第二数据拥有方的数量为多个时,分别接收每一个第二数据拥有方发送的解密得到的第二中间参数统计值;
基于第一中间参数统计值以及多个第二中间参数统计值,得到中间参数。
4.根据权利要求1所述的方法,其特征在于,所述将各训练样本划分得到的样本集合包括第一分支集合和第二分支集合;所述统计所述样本集合中所有样本的第一中间参数统计值,包括:
统计所述第一分支集合中所有训练样本的第一中间参数,得到所述第一分支集合对应的第一中间参数统计值;
基于所有训练样本的第一中间参数统计值、以及所述第一分支集合对应的第一中间参数统计值,得到所述第二分支集合对应的第一中间参数统计值。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在调整所述树模型的模型参数直至所述树模型的树结构确定后,根据所述中间参数计算所述树模型的叶子节点的节点权重。
6.根据权利要求1~5任一所述的方法,其特征在于,
所述分裂特征,包括:交易样本的交易特征;
所述第一样本标签或第二样本标签,用于表示所述交易样本是否存在风险。
7.一种基于树模型的业务预测方法,其特征在于,所述方法包括:
接收业务对象的对象特征;
将所述对象特征输入预先训练的树模型,其中,所述树模型按照权利要求1至6任一所述的方法训练得到,得到所述树模型输出的业务预测结果。
8.根据权利要求7所述的方法,其特...
【专利技术属性】
技术研发人员:朱敏杰,张天翼,陈帅,傅颖,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。