【技术实现步骤摘要】
多任务模型训练方法、任务预测方法、装置、计算机设备及介质
[0001]本专利技术涉及数据处理
,具体涉及一种多任务模型训练方法、任务预测方法、装置、计算机设备及介质。
技术介绍
[0002]随着深度学习技术的快速发展,通常要求算法多任务模型完成对目标进行检测和分类的所有任务,即算法多任务模型需要先基于获取的全局图像检测出目标的位置,再基于目标的位置对目标的属性信息进行分类。具体地,在自动驾驶场景中,若以车辆为目标,则要求算法多任务模型识别车辆的位置,并对车辆的车型、遮挡情况及车头方向等属性信息进行分类。若以车辆内的驾驶人员为目标,则要求算法多任务模型识别驾驶人员的位置,并对驾驶人员的穿戴及坐姿等属性信息进行识别。通常用于实现对目标进行检测和分类的算法多任务模型通常为包括多个任务头的多任务模型。现有的多任务模型一个任务头用于识别目标的位置,得到目标检测结果。其余的任务头用于对目标的属性信息进行分类,得到分类预测结果。
[0003]在训练多任务模型时,需要将训练集中的图像样本输入至所有的任务头,进而要求海量的图像样本中均包括对所有任务头的输出结果进行标注的标签结果,以完成对多个任务头的训练。然而,新增任务头等使得多任务模型的任务头发生变化的情况,将导致图像样本缺乏变化后的任务头所需的标签结果。当图像样本中不包括任务头的所需标签结果时,无法根据任务头输出的预测结果与标签结果对应的真实结果的偏离程度,对任务头进行数据迭代,导致了多任务模型的性能不佳。利用多任务模型对目标进行检测和分类时,无法得到准确的结果。r/>
技术实现思路
[0004]本专利技术的目的之一在于提供一种多任务模型训练方法,以解决现有技术中利用多任务模型对目标进行检测和分类时,无法得到准确的结果的问题;目的之二在于提供一种任务预测方法;目的之三在于提供一种多任务模型训练装置;目的之四在于提供一种任务预测装置;目的之五在于提供一种计算机设备;目的之六在于提供一种机器可读存储介质。
[0005]为了实现上述目的,本专利技术采用的技术方案如下:
[0006]第一方面,本申请提供一种多任务模型的训练方法,多任务模型包括共享网络、目标检测头及至少一个任务头,多任务模型的训练方法包括:
[0007]获取多个图像样本,其中,图像样本包括至少一个任务头的标签结果;
[0008]将标签结果为同一任务头的图像样本进行合并,得到每个任务头的训练集,其中,每个训练集的名称与对应的任务头的名称相同;
[0009]将每个训练集输入至共享网络,得到图像样本的特征图;
[0010]将图像样本的特征图输入至目标检测头,得到待检测目标的特征图;
[0011]针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,迭代训练多任务模型。
[0012]结合第一方面,在第一种可能的实现方式中,多任务模型的构建步骤包括:
[0013]获取每个训练集的名称;
[0014]针对每个训练集,构建与训练集的名称相同的任务头;
[0015]基于共享网络、目标检测头及所有的任务头,构建多任务模型。
[0016]结合第一方面,在第二种可能的实现方式中,针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,迭代训练多任务模型,包括:
[0017]针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,得到每个任务头的损失;
[0018]基于每个任务头的损失,依次对每个任务头进行数据迭代;
[0019]在所有任务头均完成数据迭代的情况下,执行针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,得到每个任务头的损失的步骤,直到每个任务头的损失均小于预设损失阈值。
[0020]结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,每个任务头的损失均包括目标检测头的回归损失、目标检测头的分类损失及任务头的分类损失。
[0021]结合第一方面,在第四种可能的实现方式中,共享网络还包括主干网络和中间网络,将每个训练集输入至共享网络,得到图像样本的特征图,包括:
[0022]将训练集输入至主干网络,得到初始的图像样本特征图;
[0023]将初始的图像样本特征图输入至中间网络,得到更新尺度的图像样本特征图。
[0024]结合第一方面,在第五种可能的实现方式中,每个任务头包括特征聚集层和任务网络,针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,迭代训练多任务模型,包括:
[0025]针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头的特征聚集层,得到预设尺度的待检测目标的特征图;
[0026]将预设尺度的待检测目标的特征图输入至任务网络,迭代训练多任务模型。
[0027]第二方面,本申请提供一种任务预测方法,任务预测方法包括:
[0028]获取目标图像;
[0029]将目标图像输入至多任务模型,得到目标检测结果和目标检测结果对应的至少一个任务的预测结果,其中,多任务模型根据如第一方面的多任务模型的训练方法得到。
[0030]第三方面,本申请提供一种多任务模型的训练装置,多任务模型包括目标检测头和至少一个任务头,多任务模型的训练装置包括:
[0031]图像样本获取模块,用于获取多个图像样本,其中,图像样本包括至少一个任务头的标签结果;
[0032]训练集得到模块,用于将标签结果为同一任务头的图像样本进行合并,得到每个任务头的训练集,其中,每个训练集的名称与对应的任务头的名称相同;
[0033]样本特征图得到模块,用于将每个训练集输入至共享网络,得到图像样本的特征图;
[0034]目标特征图得到模块,用于将图像样本的特征图输入至目标检测头,得到待检测
目标的特征图;
[0035]模型迭代训练模块,用于针对每个训练集,将待检测目标的特征图输入至与训练集的名称相同的任务头,迭代训练多任务模型。
[0036]第四方面,本申请提供一种任务预测装置,任务预测装置包括:
[0037]图像获取模块,用于获取目标图像;
[0038]预测结果得到模块,用于将目标图像输入至多任务模型,得到目标检测结果和目标检测结果对应的至少一个任务的预测结果,其中,多任务模型根据如第一方面的多任务模型的训练方法得到。
[0039]第五方面,本申请提供一种计算机设备,计算机设备包括存储器及处理器,存储器存储有计算机程序,计算机程序在处理器执行时,实现如第一方面的多任务模型的训练方法,或实现如第二方面的任务预测方法。
[0040]第六方面,本申请提供一种机器可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现如第一方面的多任务模型的训练方法,或实现如第二方面的任务预测方法。
[0041]本专利技术的有益效果:
[0042](1)针对每个训练集,将训练集中待检测本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种多任务模型的训练方法,其特征在于,所述多任务模型包括共享网络、目标检测头及至少一个任务头,所述多任务模型的训练方法包括:获取多个图像样本,其中,所述图像样本包括至少一个所述任务头的标签结果;将标签结果为同一所述任务头的所述图像样本进行合并,得到每个所述任务头的训练集,其中,每个所述训练集的名称与对应的所述任务头的名称相同;将每个所述训练集输入至所述共享网络,得到所述图像样本的特征图;将所述图像样本的特征图输入至所述目标检测头,得到待检测目标的特征图;针对每个所述训练集,将所述待检测目标的特征图输入至与所述训练集的名称相同的所述任务头,迭代训练所述多任务模型。2.根据权利要求1所述的多任务模型的训练方法,其特征在于,所述多任务模型的构建步骤包括:获取每个训练集的名称;针对每个所述训练集,构建与所述训练集的名称相同的所述任务头;基于所述共享网络、所述目标检测头及所有的所述任务头,构建所述多任务模型。3.根据权利要求1所述的多任务模型的训练方法,其特征在于,所述针对每个所述训练集,将所述待检测目标的特征图输入至与所述训练集的名称相同的所述任务头,迭代训练所述多任务模型,包括:针对每个所述训练集,将所述待检测目标的特征图输入至与所述训练集的名称相同的所述任务头,得到每个所述任务头的损失;基于每个所述任务头的损失,依次对每个所述任务头进行数据迭代;在所有所述任务头均完成数据迭代的情况下,执行所述针对每个所述训练集,将所述待检测目标的特征图输入至与所述训练集的名称相同的所述任务头,得到每个所述任务头的损失的步骤,直到每个所述任务头的损失均小于预设损失阈值。4.根据权利要求3所述的多任务模型的训练方法,其特征在于,每个所述任务头的损失均包括所述目标检测头的回归损失、所述目标检测头的分类损失及所述任务头的分类损失。5.根据权利要求1所述的多任务模型的训练方法,其特征在于,所述共享网络还包括主干网络和中间网络,所述将每个所述训练集输入至所述共享网络,得到所述图像样本的特征图,包括:将所述训练集输入至所述主干网络,得到初始的图像样本特征图;将所述初始的图像样本特征图输入至所述中间网络,得到更新尺度的所述图像样本特征图。6.根据权利要求1所述的多任务模型的训练方法,其特征在于,每个所述任务头包括特征聚集层和任务网络,所述针对每个所述训练集,将...
【专利技术属性】
技术研发人员:白云超,吴锐,郭晓丽,
申请(专利权)人:重庆长安汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。