【技术实现步骤摘要】
一种用于分布式模型训练的训练样本重组方法及系统
本说明书一个或多个实施例涉及多方协同模型训练,特别涉及一种用于分布式模型训练的训练样本重组方法和系统。
技术介绍
在数据分析、数据挖掘、经济预测等领域,分布式模型训练可以在保证多方数据安全的情况下,协同训练机器学习模型供多方共同使用的场景。但是,在分布式模型训练中,期望多方持有的数据集均是相同分布、数据特征之间相互独立的。对于各方数据集非独立同分布状态(Non-IID)时,由于各方持有数据分布的不均匀性,采用分布式学习进行模型训练会使得模型训练过程产生偏差,进而影响训练得到模型的整体性能。因此,有必要提出一种用于分布式模型训练的训练样本重组方法以降低各方数据分布不均匀的问题。
技术实现思路
本说明书一个方面提供一种用于分布式模型训练的训练样本重组方法,所述方法由参与方中的服务器实现,其中,所述参与方包括多个训练成员以及服务器;所述方法包括:获取融合训练样本集;所述融合训练样本集包括来自一个或多个训练成员的训练样本;获取第一模型,并将所述第一模型发送给各训练成员;对各训练成员进行一轮或多轮训练样本重组,其中每轮重组包括:获取当前轮的传输比例系数;基于所述传输比例系数为各训练成员从所述融合训练样本集中选择部分训练样本并下发;获取各训练成员上传的当前轮对应的模型性能参数;所述当前轮对应的模型性能参数为训练成员基于自身持有的训练样本以及服务器下发的训练样本进行模型训练得到的模型的模型性能参数;确定进行下一轮重组,或者停止重组。本说明书另一个方 ...
【技术保护点】
1.一种用于分布式模型训练的训练样本重组方法,所述方法由参与方中的服务器实现,其中,所述参与方包括多个训练成员以及服务器;所述方法包括:/n获取融合训练样本集;所述融合训练样本集包括来自一个或多个训练成员的训练样本;/n获取第一模型,并将所述第一模型发送给各训练成员;/n对各训练成员进行一轮或多轮训练样本重组,其中每轮重组包括:/n获取当前轮的传输比例系数;/n基于所述传输比例系数为各训练成员从所述融合训练样本集中选择部分训练样本并下发;/n获取各训练成员上传的当前轮对应的模型性能参数;所述当前轮对应的模型性能参数为训练成员基于自身持有的训练样本以及服务器下发的训练样本进行模型训练得到的模型的模型性能参数;/n确定进行下一轮重组,或者停止重组。/n
【技术特征摘要】
1.一种用于分布式模型训练的训练样本重组方法,所述方法由参与方中的服务器实现,其中,所述参与方包括多个训练成员以及服务器;所述方法包括:
获取融合训练样本集;所述融合训练样本集包括来自一个或多个训练成员的训练样本;
获取第一模型,并将所述第一模型发送给各训练成员;
对各训练成员进行一轮或多轮训练样本重组,其中每轮重组包括:
获取当前轮的传输比例系数;
基于所述传输比例系数为各训练成员从所述融合训练样本集中选择部分训练样本并下发;
获取各训练成员上传的当前轮对应的模型性能参数;所述当前轮对应的模型性能参数为训练成员基于自身持有的训练样本以及服务器下发的训练样本进行模型训练得到的模型的模型性能参数;
确定进行下一轮重组,或者停止重组。
2.根据权利要求1所述的方法,所述获取第一模型,包括:
利用所述融合训练样本集对初始模型进行训练,得到所述第一模型。
3.根据权利要求1所述的方法,所述获取当前轮的传输比例系数,包括:
通过搜索算法获取所述传输比例系数。
4.根据权利要求1所述的方法,所述当前轮对应的模型性能参数为训练成员利用自身持有的训练样本以及当前轮服务器下发的训练样本训练所述第一模型得到的模型的模型性能参数。
5.根据权利要求1所述的方法,所述确定进行下一轮重组,或者停止重组,包括:
若重组轮数小于设定阈值,则确定进行下一轮重组;否则,停止重组。
6.根据权利要求5所述的方法,当确定停止重组后,还包括:
计算来自各训练成员的当前轮对应的模型性能参数的平均值,得到当前轮对应的平均性能;
获取此前多轮重组所计算的平均性能;
将最优平均性能对应的重组轮次中各训练成员的训练样本重组结果确定为最终的重组结果。
7.根据权利要求1所述的方法,所述确定进行下一轮重组,或者停止重组,包括:
基于各训练成员的当前轮对应的模型性能参数确定预设条件是否被满足;若被满足,则停止重组并将当前轮中各训练成员的训练样本重组结果确定为最终的重组结果;否则,确定进行下一轮重组。
8.根据权利要求6或7所述的方法,所述方法还包括:
通知各训练成员最终的重组结果对应的重组轮次。
9.根据权利要求1所述的方法,各训练成员上传给服务器的训练样本、服务器下发给训练成员的训练样本以及各训练成员上传给服务器的当前轮对应的模型性能参数均以密文形式传输。
10.一种基于分布式模型训练的训练样本重组系统,所述系统由参与方中的服务器实现,其中,所述参与方包括多个训练成员以及服务器;所述系统包括:
融合训练样本集获取模块:用于获取融合训练样本集;所述融合训练样本集包括来自一个或多个训练成员的训练样本;
第一初始模型获取模块:用于获取第一模型,并将所述第一模型发送给各训练成员;
第一训练样本重组模块:用于对各训练成员进行一轮或多轮训练样本重组,其进一步包括以下单元以完成任一轮训练样本重组:
传输比例系数获取单元:用于获取当前轮的传输比例系数;
训练样本下发单元:用于基于所述传输比例系数为各训练成员从所述融合训练样本集中选择部分训练样本并下发;
模型性能参数获取单元:用于获取各训练成员上传的当前轮对应的模型性能参数;所述当前轮对应的模型性能参数为训练成员基于自身持有的训练样本以及服务器下发的训练样本进行模型训练得到的模型的模型性能参数;
确定单元,用于确定进行下一轮重组,或者停止重组。
11.一种用于分布式模型训练的训练样本重组的装置,所述装置包括处理器以及存储器;所述存储器用于存储指令,所述处理器用于执行所述指令,以实现如权利要求1至9中任一项所述用于分布式模型训练的训练样本重组的操作。
12.一种基于分布式...
【专利技术属性】
技术研发人员:郑龙飞,周俊,王力,陈超超,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。