一种多任务学习模型训练方法、装置和设备制造方法及图纸

技术编号:40164520 阅读:20 留言:0更新日期:2024-01-26 23:37
本申请提供一种多任务学习模型训练方法,包括:针对第一样本集中的每个样本,基于预先训练好的任务类别不同的多类单任务模型,生成所述每个样本在所述每类单任务模型下的伪标签;其中,所述每类单任务模型的任务类别组成的任务类别集与待训练的多任务学习模型的任务类别集相同;根据所述每个样本在所述每类单任务模型下的伪标签,确定所述每个样本的综合标签;其中,所述综合标签包括多类对应于所述任务类别集的标签;利用所述第一样本集、所述每个样本的综合标签,训练所述多任务学习模型,得到预训练的多任务学习模型。本申请提供的多任务学习模型训练方法、装置和设备,可以训练出预测能力较强、并能实现多个任务的多任务学习模型。

【技术实现步骤摘要】

本申请涉及深度学习,尤其涉及一种多任务学习模型训练方法、装置和设备


技术介绍

1、随着算法、硬件和数据集的不断发展,深度学习在过去十几年里得到了广泛应用。

2、近年来,深度学习在计算机视觉、自然语言处理、语音识别等任务上取得了惊人的成就。在计算机视觉领域,深度学习模型能够高效地识别和分类图像,实现人脸识别、物体检测、图像分割等应用。在自然语言处理方面,深度学习模型能够理解和生成自然语言,实现机器翻译、情感分析、智能对话等功能。在语音识别领域,深度学习技术使得语音助手和语音识别系统的准确率大幅提升,为人机交互带来全新的体验。

3、目前,为了解决模型碎片化的问题,一般采用多任务学习模型解决计算机视觉、自然语言处理、语音识别等任务,在这种情况下,如何提高多任务学习模型的预测能力成为当前亟待解决的问题。


技术实现思路

1、有鉴于此,本申请提供一种多任务学习模型训练方法、装置和设备,以提高多任务学习模型的预测能力。

2、具体地,本申请是通过如下技术方案实现的:</p>

3、本申本文档来自技高网...

【技术保护点】

1.一种多任务学习模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述每类单任务模型包括至少一个单任务模型;根据所述每个样本在所述每类单任务模型下的伪标签,确定所述每个样本的综合标签,包括:

3.根据权利要求1或2所述的方法,其特征在于,得到所述预训练的多任务学习模型之后,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述多任务学习模型为YOLO模型;所述YOLO模型包括编码器、以及多个与所述编码器连接的解码器;其中,每个所述解码器对应所述任务类别集中的一个任务类别。

5.根据权利要求1任一...

【技术特征摘要】

1.一种多任务学习模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述每类单任务模型包括至少一个单任务模型;根据所述每个样本在所述每类单任务模型下的伪标签,确定所述每个样本的综合标签,包括:

3.根据权利要求1或2所述的方法,其特征在于,得到所述预训练的多任务学习模型之后,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述多任务学习模型为yolo模型;所述yolo模型包括编码器、以及多个与所述编码器连接的解码器;其中,每个所述解码器对应所述任务类别集中的一个任务类别。

5.根据权利要求1任一项所述的方法,其特征在于,每个所述单任务模型为基于transformer架构的深度学习模型。

6.根据权利要...

【专利技术属性】
技术研发人员:唐炜森
申请(专利权)人:深圳云天励飞技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1