一种多任务模型的训练方法技术

技术编号:24709306 阅读:68 留言:0更新日期:2020-07-01 00:10
本发明专利技术涉及一种多任务模型的训练方法,包括:S1.抽取多个数据集中的样本数据,其中,每个所述数据集中的所述样本数据均为单一任务的属性;S2.采用抽取的所述样本数据对神经网络模型进行训练,得到多任务模型,其中,所述神经网络模型为用于分类的神经网络模型;S3.基于所述多任务模型的输出结果获取所述多任务模型的总损失函数。本发明专利技术提出的多任务模型训练方法,对于数据集要求较低,允许每张图像仅包含一个任务的标签(即单一属性),对于特征接近的任务,比如人体属性等,能够在一个模型上进行合并训练。具有合并周期短,且保证精度不变的情况下,极大程度上提升计算效率。

【技术实现步骤摘要】
一种多任务模型的训练方法
本专利技术涉及计算机机器学习
,尤其涉及一种多任务模型的训练方法。
技术介绍
深度学习作为机器学习领域中一个新的研究方向,目前已经在图像识别,语音识别,自然语言处理等相关领域都取得很多成果。但是由于深度学习模型计算复杂,效率低,而一般生产环境都有明确的性能指标,还有空间要求,比如内存等资源有限。如果对于一些相近的任务,比如人体属性中的性别、服饰类别等进行估计,往往都各自使用一个模型,无疑增加了计算量和资源占用。近几年,多任务模型发展迅速。但是由于这些任务的训练数据往往都是独立的,每张图像不可能具有所有的属性标签,而数据标注的成本十分巨大,对于数据补标注不太现实。例如,中国专利申请号CN201710603212,名称为“针对人体属性分类的自适应权重调整的模型训练方法”的方案,虽然也是一种多任务的模型训练方法,但是要求每张图像必须包含每个任务的标注信息,包括人脸属性和人体属性。主要创新点为引入了一个基于验证误差大小及变化趋势从而更新相应任务权重的算法,在训练过程中自适应动态地调整每个任务的相应权重值。本文档来自技高网...

【技术保护点】
1.一种多任务模型的训练方法,包括:/nS1.抽取多个数据集中的样本数据,其中,每个所述数据集中的所述样本数据均为单一任务的属性;/nS2.采用抽取的所述样本数据对神经网络模型进行训练,得到多任务模型,其中,所述神经网络模型为用于分类的神经网络模型;/nS3.基于所述多任务模型的输出结果获取所述多任务模型的总损失函数。/n

【技术特征摘要】
1.一种多任务模型的训练方法,包括:
S1.抽取多个数据集中的样本数据,其中,每个所述数据集中的所述样本数据均为单一任务的属性;
S2.采用抽取的所述样本数据对神经网络模型进行训练,得到多任务模型,其中,所述神经网络模型为用于分类的神经网络模型;
S3.基于所述多任务模型的输出结果获取所述多任务模型的总损失函数。


2.根据权利要求1所述的训练方法,其特征在于,还包括:
S4.重复执行步骤S1-S3,根据所述多任务模型的输出结果计算所述总损失函数,并根据所述总损失函数对所述多任务模型的模型参数进行优化。


3.根据权利要求2所述的训练方法,其特征在于,在步骤S1中,以预设规则分别随机排列各所述数据集中的所述样本数据后抽取各所述数据集中的所述样本数据。


4.根据权利要求1至3所述的训练方法,其特征在于,步骤S1中,抽取多个数据集中的样本数据的步骤中,按照各所述数据集所包含的所述样本数据量之间的比例抽取。


5.根据权利要求4所述的训练方法,其特征在于,步骤S1中,每个所述数据集之间...

【专利技术属性】
技术研发人员:张奎陈清梁王超
申请(专利权)人:浙江新再灵科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1