基于自适应矩估计的多任务模型训练方法技术

技术编号:43968113 阅读:20 留言:0更新日期:2025-01-10 19:57
本发明专利技术的一种基于自适应矩估计的多任务模型训练方法,包括以下步骤:第1步骤、阶段一检测多任务模型训练:第11步骤、获取检测任务数据,数据打包;第12步骤、自适应缩放调整;第13步骤、数据增强;第14步骤、共享骨干网络;第15步骤、损失计算;第16步骤、梯度计算;第17步骤、多任务解耦的自适应矩估计优化策略;第2步骤、阶段二多任务模型冻结训练;第3步骤、阶段三多任务模型解冻训练。该方法基于自适应矩估计的多任务模型训练采用多任务解耦的自适应矩估计优化策略,结合多阶段训练进行多任务模型训练,有效提升了多任务模型的准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能和智能驾驶的,尤其是一种基于自适应矩估计的多任务模型训练方法


技术介绍

1、多任务学习(multi-task learning,mtl)作为一种重要的深度学习方法,广泛应用于自然语言处理(nlp)、计算机视觉(cv)等领域。相比于单任务学习,多任务学习具有显著的优势,特别是在内存占用和推理速度方面,多个任务共享参数,不仅减少了内存消耗,而且能够通过一次前向计算同时输出多个任务的结果,极大地提高了推理效率。同时,通过在多个任务之间共享参数,多任务学习能够有效利用不同任务之间的相关性,从而在模型的训练中实现知识的迁移,提升模型的泛化能力和整体性能。

2、然而,多任务学习在实际应用中面临着诸多挑战,其中,负迁移(negativetransfer)和跷跷板效应(seesaw effect)是最为常见的问题。负迁移现象是指不同任务之间的冲突和不一致导致的相互干扰,最终使得某些任务的性能反而不如单独训练时的效果。而跷跷板效应则表现为,当一个任务的性能提升时,另一个任务的性能下降,导致整个多任务模型的效果不稳定且难以收敛。

...

【技术保护点】

1.一种基于自适应矩估计的多任务模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:所述第2步骤的具体步骤如下:

3.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:所述第3步骤的具体步骤如下:

4.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:在所述第12步骤中,对原始图像进行尺寸调整,即通过自适应缩放调整方法将原始图像调整至960×512的目标尺寸,自适应缩放调整的具体操作步骤如下:

5.根据权利要求1所述的基于自适应矩估计的多...

【技术特征摘要】

1.一种基于自适应矩估计的多任务模型训练方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:所述第2步骤的具体步骤如下:

3.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:所述第3步骤的具体步骤如下:

4.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:在所述第12步骤中,对原始图像进行尺寸调整,即通过自适应缩放调整方法将原始图像调整至960×512的目标尺寸,自适应缩放调整的具体操作步骤如下:

5.根据权利要求1所述的基于自适应矩估计的多任务模型训练方法,其特征在于:在所述第15步骤中,检测任务的损失值由类别损失和定位损失组成。

6.根据...

【专利技术属性】
技术研发人员:高尔峰
申请(专利权)人:常州星宇车灯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1