一种多任务训练方法和设备技术

技术编号:26260103 阅读:32 留言:0更新日期:2020-11-06 17:55
本发明专利技术提出了一种多任务训练方法和设备,该方法包括:步骤A、从同时训练的多个任务中选择一个未训练完成的任务作为第一任务;各任务均包括一模型和与模型对应的训练集;模型包括共享部分与独享部分;训练集分为多个数据团;步骤B、从多个数据团中选择一个数据团对第一模型进行一次训练并更新参数;第一模型为第一任务包括的模型;步骤C、将训练完成第一模型的共享部分赋值给其他模型的共享部分;其他模型为除第一任务以外的其他任务包括的模型;步骤D、重复执行步骤A‑C,直到训练完成所有的任务。基于共享部分共享,使得不需要为每个任务进行损失函数的设置,能有效应对多个任务,以及新类型的任务的训练需要。

【技术实现步骤摘要】
一种多任务训练方法和设备
本专利技术涉及数据处理
,特别涉及一种多任务训练方法和设备。
技术介绍
现有方法为了实现多任务训练,需要为每个任务设置对应的损失函数;这使得,针对有多个任务,且各个任务对应有模型的情况下,按照现有的办法,无法直接利用模型来对任务进行训练,而需要重新为每个任务设置对应的损失函数,而任务数量比较多,为每个任务单独设置对应的损失函数,效率很低下,无法应对任务数量多,以及当有新的任务类型出现,不能快速进行处理的需要。由此,目前需要一种可以解决上述缺陷的方案。
技术实现思路
有鉴于此,本专利技术提出了一种多任务训练方法和设备,基于共享部分共享,使得不需要为每个任务进行损失函数的设置,能有效应对多个任务,以及新类型的任务的训练需要。具体的,本专利技术提出了以下具体的实施例:本专利技术实施例提出了一种多任务训练方法,包括:步骤A、从同时训练的多个任务中选择一个未训练完成的任务作为第一任务;各所述任务均包括一模型和与所述模型对应的训练集;所述模型包括共享部分与独享部分;所述训练本文档来自技高网...

【技术保护点】
1.一种多任务训练方法,其特征在于,包括:/n步骤A、从同时训练的多个任务中选择一个未训练完成的任务作为第一任务;各所述任务均包括一模型和与所述模型对应的训练集;所述模型包括共享部分与独享部分;所述训练集分为多个数据团;/n步骤B、从多个所述数据团中选择一个数据团对第一模型进行一次训练并更新参数;所述第一模型为所述第一任务包括的模型;/n步骤C、将训练完成所述第一模型的共享部分赋值给其他模型的共享部分;所述其他模型为除所述第一任务以外的其他任务包括的模型;/n步骤D、重复执行步骤A-C,直到训练完成所有的所述任务。/n

【技术特征摘要】
1.一种多任务训练方法,其特征在于,包括:
步骤A、从同时训练的多个任务中选择一个未训练完成的任务作为第一任务;各所述任务均包括一模型和与所述模型对应的训练集;所述模型包括共享部分与独享部分;所述训练集分为多个数据团;
步骤B、从多个所述数据团中选择一个数据团对第一模型进行一次训练并更新参数;所述第一模型为所述第一任务包括的模型;
步骤C、将训练完成所述第一模型的共享部分赋值给其他模型的共享部分;所述其他模型为除所述第一任务以外的其他任务包括的模型;
步骤D、重复执行步骤A-C,直到训练完成所有的所述任务。


2.如权利要求1所述的方法,其特征在于,所述“从同时训练的多个任务中选择一个未训练完成的任务作为第一任务”,包括:
从同时训练的多个任务中随机选择未训练完成的一个任务作为第一任务。


3.如权利要求1所述的方法,其特征在于,所述随机选择是基于下列公式来进行的:

其中,所述pi为第i个任务被随机选择到的概率;所述cj为第j个任务的模型已经更新的次数;tj为第j个任务的模型需要更新的次数;n为任务总数;所述ti为第i个任务的模型需要更新的次数;所述ci为第i个任务的模型已经更新的次数。


4.如权利要求1所述的方法,其特征在于,所有的所述任务是否被训练完成是基于下列判断来进行的:
判断是否等于0;
其中,所述cj为第j个任务的模型已经更新的次数;所述tj为第j个任务的模型需要更新的次数;n为任务总数;
若判断结果为是,则确定训练完成所有的所述任务;
若判断结果为否,则确定未训练完成所有的所述任务。


5.如权利要求4所述的方法,其特征在于,所述第j个任务的模型需要更新的次数通过以下公式来进行确定:
tj=m×bj;其中,m为训练轮数;bj为第j个任务对应的训练集包括的数据团的数量。


6...

【专利技术属性】
技术研发人员:曾祥荣
申请(专利权)人:云知声智能科技股份有限公司厦门云知芯智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1