目标对象检测模型的训练方法、装置及计算机程序产品制造方法及图纸

技术编号:34963496 阅读:12 留言:0更新日期:2022-09-17 12:43
本公开提供了一种目标对象检测模型的训练方法、装置、电子设备、存储介质及程序产品,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:将样本图像输入第一对象检测模型,得到对象检测结果;通过预设损失函数确定对象检测结果与样本图像的对象标签之间的损失信息;根据损失信息调整第一对象检测模型的参数,得到训练后的第二对象检测模型;其中,预设损失函数基于平滑L1范数损失函数得到,在对象检测结果、对象标签之间的第一差值的绝对值大于预设数值的情况下,预设损失函数的第一梯度小于平滑L1范数损失函数的第二梯度。本公开在梯度回传层面产生了对噪声数据的抑制作用,提高了目标检测模型的准确度。测模型的准确度。测模型的准确度。

【技术实现步骤摘要】
目标对象检测模型的训练方法、装置及计算机程序产品


[0001]本公开涉及人工智能
,具体涉及深度学习、图像处理、计算机视觉
,尤其涉及目标对象检测模型的训练方法、装置以及目标对象检测方法、装置、电子设备、存储介质以及计算机程序产品,可用于目标对象检测场景下。

技术介绍

[0002]基于深度学习的目标对象检测方法作为人工智能快速发展的主航道,已经初步落地到了工业、遥感、农业、无人驾驶等各个领域。目前,所有的目标对象检测方法都是建立在一定数据基础上的,需要人工标注目标对象标签的图像数据作为支撑。然而,人工标注的图像标签中的噪声问题是不可避免的,数据量越大,存在偏差的标注数据就越多,数据标签存在的噪声就会影响模型的训练精度。

技术实现思路

[0003]本公开提供了一种目标对象检测模型的训练方法、装置以及目标对象检测方法、装置、电子设备、存储介质以及计算机程序产品。
[0004]根据第一方面,提供了一种目标对象检测模型的训练方法,包括:将样本图像输入第一对象检测模型,得到对象检测结果;通过预设损失函数确定对象检测结果与样本图像的对象标签之间的损失信息;根据损失信息调整第一对象检测模型的参数,得到训练后的第二对象检测模型;其中,预设损失函数基于平滑L1范数损失函数得到,在对象检测结果、对象标签之间的第一差值的绝对值大于预设数值的情况下,预设损失函数的第一梯度小于平滑L1范数损失函数的第二梯度。
[0005]根据第二方面,提供了一种目标对象检测方法,包括:获取待检测图像;将待检测图像输入训练后的第二对象检测模型,通过第二对象检测模型中的特征提取网络进行特征提取,得到特征图;根据特征图,确定待检测图像中的候选区域和表征每个候选区域包括目标对象的概率值;根据特征图、候选区域和概率值进行回归预测,确定待检测图像中的目标对象,其中,第二对象检测模型通过第一方面任一实现方式训练得到。
[0006]根据第三方面,提供了一种目标对象检测模型的训练装置,包括:得到单元,被配置成将样本图像输入第一对象检测模型,得到对象检测结果;第一确定单元,被配置成通过预设损失函数确定对象检测结果与样本图像的对象标签之间的损失信息;训练单元,被配置成根据损失信息调整第一对象检测模型的参数,得到训练后的第二对象检测模型;其中,预设损失函数基于平滑L1范数损失函数得到,在对象检测结果、对象标签之间的第一差值的绝对值大于预设数值的情况下,预设损失函数的第一梯度小于平滑L1范数损失函数的第二梯度。
[0007]根据第四方面,提供了一种目标对象检测装置,包括:第二获取单元,被配置成获取待检测图像;提取单元,被配置成将待检测图像输入训练后的第二对象检测模型,通过第二对象检测模型中的特征提取网络进行特征提取,得到特征图;第二确定单元,被配置成根
据特征图,确定待检测图像中的候选区域和表征每个候选区域包括目标对象的概率值;第三确定单元,被配置成根据特征图、候选区域和概率值进行回归预测,确定待检测图像中的目标对象,其中,第二对象检测模型通过第三方面任一实现方式训练得到。
[0008]根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面、第二方面任一实现方式描述的方法。
[0009]根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面、第二方面任一实现方式描述的方法。
[0010]根据第七方面,提供了一种计算机程序产品,包括:计算机程序,计算机程序在被处理器执行时实现如第一方面、第二方面任一实现方式描述的方法。
[0011]根据本公开的技术,提供了一种目标对象检测模型的训练方法,在平滑L1范数损失函数的基础上,当相对应的对象检测结果、标签之间的偏差的绝对值大于预设数值时,减小平滑L1范数损失函数的梯度,改进得到预设损失函数,以基于预设损失函数训练目标对象检测模型,从而在梯度回传层面产生了对噪声数据的抑制作用,提高了目标检测模型的准确度。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开的一个实施例可以应用于其中的示例性系统架构图;
[0015]图2是根据本公开的目标对象检测模型的训练方法的一个实施例的流程图;
[0016]图3是根据本实施例的平滑L1范数损失函数的曲线示意图。
[0017]图4是根据本实施例的目标对象检测模型的训练方法的应用场景的示意图;
[0018]图5是根据本实施例的平滑L1范数损失函数和预设损失函数的对比曲线图;
[0019]图6是根据本实施例的平滑L1范数损失函数和预设损失函数的又一对比曲线图;
[0020]图7是根据本公开的目标对象检测模型的训练方法的又一个实施例的流程图;
[0021]图8是根据本公开的目标对象检测方法的一个实施例的流程图;
[0022]图9是根据本公开的目标对象检测模型的训练装置的一个实施例的结构图;
[0023]图10是根据本公开的目标对象检测装置的一个实施例的结构图;
[0024]图11是适于用来实现本公开实施例的计算机系统的结构示意图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提
供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0027]图1示出了可以应用本公开的目标对象检测模型的训练方法及装置、目标对象检测方法及装置的示例性架构100。
[0028]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。终端设备101、102、103之间通信连接构成拓扑网络,网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0029]终端设备101、102、103可以是支持网络连接从而进行数据交互和数据处理的硬件设备或软件。当终端设备101、102、103为硬件时,其可以是支持网络连接,信息获取、交互、显示、处理等功能的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象检测模型的训练方法,包括:将样本图像输入第一对象检测模型,得到对象检测结果;通过预设损失函数确定所述对象检测结果与所述样本图像的对象标签之间的损失信息;根据所述损失信息调整所述第一对象检测模型的参数,得到训练后的第二对象检测模型;其中,所述预设损失函数基于平滑L1范数损失函数得到,在所述对象检测结果、所述对象标签之间的第一差值的绝对值大于预设数值的情况下,所述预设损失函数的第一梯度小于所述平滑L1范数损失函数的第二梯度。2.根据权利要求1所述的方法,其中,所述方法还包括:在所述绝对值小于或等于所述预设数值的第一数值段的情况下,根据与所述平滑L1范数损失函数相同的第一函数段,得到第二函数段;在所述绝对值大于所述预设数值的第二数值段的情况下,调整所述平滑L1范数损失函数中第二数值段对应的第三函数段,得到第四函数段,以使得所述第一梯度小于所述第二梯度;基于所述第二函数段和所述第四函数段,获取所述预设损失函数。3.根据权利要求2所述的方法,其中,所述绝对值与第二差值之间呈正相关关系;其中,所述第二差值为所述第一梯度与所述第二梯度之间的差值。4.根据权利要求1所述的方法,其中,所述将样本图像输入第一对象检测模型,得到对象检测结果,包括:将所述样本图像输入所述第一对象检测模型,通过所述第一对象检测模型中的特征提取网络进行特征提取,得到特征图;根据所述特征图,确定所述样本图像中的候选区域和表征每个所述候选区域包括所述目标对象的概率值;根据所述特征图、所述候选区域和所述概率值进行回归预测,得到表征目标对象的边界预测值的所述对象检测结果。5.一种目标对象检测方法,包括:获取待检测图像;将所述待检测图像输入训练后的第二对象检测模型,通过所述第二对象检测模型中的特征提取网络进行特征提取,得到特征图;根据所述特征图,确定所述待检测图像中的候选区域和表征每个所述候选区域包括目标对象的概率值;根据所述特征图、所述候选区域和所述概率值进行回归预测,确定所述待检测图像中的目标对象,其中,所述第二对象检测模型通过权利要求1

4中任一项训练得到。6.一种目标对象检测模型的训练装置,包括:得到单元,被配置成将样本图像输入第一对象检测模型,得到对象检测结果;第一确定单元,被配置成通过预设损失函数确定所述对象检测结果与所述样本图像的对象标签之间的损失信息;训练单元,被配置成根据所述损失信息调整所述第一对象检测模型的参数,得到训练
后的第二对象检测模型;其中,所述预设损失函数基于平滑L1范数损失函数得到,...

【专利技术属性】
技术研发人员:王云浩张滨陈松李超辛颖冯原韩树民
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1