目标检测模型的训练和目标检测方法、装置、设备及介质制造方法及图纸

技术编号:30692600 阅读:15 留言:0更新日期:2021-11-06 09:26
本公开提供了一种目标检测模型的训练和目标检测方法、装置、设备及介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,具体可用于智慧城市和智能交通场景下。具体实现方案为:利用第一目标检测模型的特征提取层提取出第一类别的第一样本图片的初始卷积特征;利用第一目标检测模型的特征增强层确定出初始卷积特征中待增强的目标通道,并对目标通道进行增强,得到目标卷积特征;基于目标卷积特征,获取针对第一样本图片的目标检测结果;基于目标检测结果第一损失值对第一目标检测模型进行训练。通过上述训练方法得到的第一目标检测模型,再次基于少量的新颖类别的样本图片训练之后,针对新颖类别的图片依然可以具备较高的泛化检测能力。高的泛化检测能力。高的泛化检测能力。

【技术实现步骤摘要】
目标检测模型的训练和目标检测方法、装置、设备及介质


[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,具体可用于智慧城市和智能交通场景下。

技术介绍

[0002]基于深度学习的目标检测方法作为人工智能快速发展的主航道,已经初步落地到了工业、遥感、农业、无人驾驶等各个领域。目前的绝大多数目标检测模型的训练过程都是建立在大量的样本数据基础上的,需要海量图像数据作为支撑。
[0003]然而,基于大量样本数据来训练目标检测模型方式存在诸多缺陷,例如,获取大量的样本数据的需要耗费过多的时间和人力,这会增加目标检测模型的训练成本;或者,某些图片类别所具备的样本数据量过少,导致训练出目标检测模型无法达到期望的效果。

技术实现思路

[0004]本公开提供了一种目标检测模型的训练和目标检测方法、装置、设备及介质。
[0005]根据本公开的第一方面,提供了一种目标检测模型的训练方法,包括:
[0006]将第一类别的第一样本图片输入到第一目标检测模型的特征提取层,利用特征提取层提取出初始卷积特征;
[0007]将初始卷积特征输入到第一目标检测模型的特征增强层,利用特征增强层确定出初始卷积特征中待增强的目标通道,并对目标通道进行增强,得到目标卷积特征;
[0008]基于目标卷积特征,获取针对第一样本图片的目标检测结果;
[0009]确定第一样本图片的目标检测结果对应的第一损失值,基于第一损失值对第一目标检测模型进行训练,直至第一损失值达到第一预设损失阈值。<br/>[0010]根据本公开的第二方面,提供了一种目标检测方法,包括:
[0011]将第二类别的待检测图片输入到根据本公开的第二方面提供的训练方法得到的第二目标检测模型;
[0012]利用第二目标检测模型输出针对待检测图片的目标检测结果。
[0013]根据本公开的第三方面,提供了一种目标检测模型的训练装置,包括:
[0014]特征提取模块,用于将第一类别的第一样本图片输入到第一目标检测模型的特征提取层,利用特征提取层提取出初始卷积特征;
[0015]特征增强模块,用于将初始卷积特征输入到第一目标检测模型的特征增强层,利用特征增强层确定出初始卷积特征中待增强的目标通道,并对目标通道进行增强,得到目标卷积特征;
[0016]第一目标检测模块,用于基于目标卷积特征,获取针对第一样本图片的目标检测结果;
[0017]第一模型训练模块,用于确定第一样本图片的目标检测结果对应的第一损失值,基于第一损失值对第一目标检测模型进行训练,直至第一损失值达到第一预设损失阈值。
[0018]根据本公开的第四方面,提供了一种目标检测装置,包括:
[0019]图片输入模块,用于将第二类别的待检测图片输入到根据本公开的第二方面提供的训练方法得到的第二目标检测模型;
[0020]结果输出模块,用于利用第二目标检测模型输出针对待检测图片的目标检测结果。
[0021]根据本公开的第五方面,提供了一种电子设备,包括:
[0022]至少一个处理器;以及
[0023]与所述至少一个处理器通信连接的存储器;其中,
[0024]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的第一方面提供的训练方法。
[0025]根据本公开的第六方面,提供了一种电子设备,包括:
[0026]至少一个处理器;以及
[0027]与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的第二方面提供的目标检测方法。
[0028]根据本公开的第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开的第一方面提供的训练方法。
[0029]根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第二方面提供的目标检测方法。
[0030]根据本公开的第九方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的第一方面提供的训练方法。
[0031]根据本公开的第十方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开的第二方面提供的目标检测方法。
[0032]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
[0033]本公开提供的技术方案带来的有益效果是:
[0034]在本公开的技术方案中,第一目标检测模型设置了特征增强层,在对第一目标检测模型进行训练后,其特征增强层能够具备基于图片的特性对其卷积特征中的至少部分通道进行增强的能力。特征增强层的这种对通道进行增强的能力,可以确保第一目标检测模型再次基于少量的新颖类别的样本图片训练之后,针对新颖类别的图片依然可以具备较高的泛化检测能力。也就是说,在新颖类别的样本数据量较少的情况下,可以通过少量的新颖类别的样本图片继续对第一目标检测模型,即可以使得第一目标检测模型具备较优的针对新颖类别的样本图片的目标检测能力,这可以显著地减少训练适用于新颖类别的图片的目标检测模型所需要的样本数据量,极大地降低目标检测模型的训练成本。
附图说明
[0035]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0036]图1示出了本公开实施例提供的目标检测模型的示意性结构图;
[0037]图2示出了本公开实施例提供的一种目标检测模型的训练方法的流程示意图;
[0038]图3示出了本公开实施例提供的另一种目标检测模型的训练方法的流程示意图;
[0039]图4示出了本公开实施例提供的又一种目标检测模型的训练方法的流程示意图;
[0040]图5示出了本公开实施例提供的一种目标检测方法的流程示意图;
[0041]图6示出了本公开实施例提供的一种目标检测模型的训练装置的结构示意图之一;
[0042]图7示出了本公开实施例提供的另一种目标检测模型的训练装置的结构示意图之二;
[0043]图8示出了本公开实施例提供的一种目标检测装置的结构示意图;
[0044]图9示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0045]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,包括:将第一类别的第一样本图片输入到第一目标检测模型的特征提取层,利用所述特征提取层提取出初始卷积特征;将所述初始卷积特征输入到第一目标检测模型的特征增强层,利用所述特征增强层确定出所述初始卷积特征中待增强的目标通道,并对所述目标通道进行增强,得到目标卷积特征;基于所述目标卷积特征,获取针对所述第一样本图片的目标检测结果;确定所述第一样本图片的目标检测结果对应的第一损失值,基于所述第一损失值对所述第一目标检测模型进行训练,直至所述第一损失值达到第一预设损失阈值。2.根据权利要求1所述的方法,其中,所述利用所述特征增强层确定出所述初始卷积特征中待增强的目标通道,包括:利用所述特征增强层,计算出所述初始卷积特征中的每个通道的子矩阵中各元素的第一平均值;将对应的所述第一平均值小于第一预设值的通道,确定为所述初始卷积特征中待增强的目标通道。3.根据权利要求2所述的方法,所述第一预设值为所述初始卷积特征的矩阵中各元素的第二平均值;所述将对应的所述第一平均值小于第一预设值的通道,确定为所述初始卷积特征中待增强的目标通道,包括:利用所述特征增强层,计算所述初始卷积特征的矩阵中各元素的第二平均值;将对应的所述第一平均值小于所述第二平均值的通道,确定为所述初始卷积特征中待增强的目标通道。4.根据权利要求1所述的方法,其中,所述对所述目标通道进行增强,包括:基于所述目标通道的子矩阵、以及与所述目标通道相邻的通道的子矩阵,增大所述目标通道的子矩阵中各元素的值。5.根据权利要求4所述的方法,通过如下公式来增大所述目标通道的子矩阵中各元素的值:C
iA
=w1
×
C
i
+w2
×
C
i+1
,其中,C
iA
是增强后的所述目标通道的子矩阵,C
i
是待增强的所述目标通道的子矩阵,C
i+1
是与所述目标通道相邻的通道的子矩阵,w1和w2是可训练的权重值,i可以表示目标通道的序号。6.根据权利要求1至5中任一项所述的方法,在所述基于所述第一损失值对所述第一目标检测模型进行训练,直至所述第一损失值达到第一预设损失阈值之后,还包括:将第二类别的第二样本图片输入到所述第一目标检测模型,利用所述第一目标检测模型输出针对所述第二样本图片的目标检测结果;确定所述第二样本图片的目标检测结果对应的第二损失值,基于所述第二损失值对所述第一目标检测模型进行训练,当所述第二损失值达到第二预设损失阈值时结束训练,得到适用于所述第二类别的图片的目标检测任务的第二目标检测模型。7.一种目标检测方法,包括:
将第二类别的待检测图片输入到根据权利要求6所述的训练方法得到的第二目标检测模型;利用所述第二目标检测模型输出针对所述待检测图片的目标检测结果。8.一种目标检测模型的训练装置,包括:特征提取模块,用于将第一类别的第一样本图片输入到第一目标检测模型的特征提取层,利用所述特征提取层提取出初始卷积特征;特征增强模块,用于将所述初始卷积特征输入到第一目标检测模型的特征增强层,利用所述特征增强层确定出所述初始卷积特征中待增强的目标通道,并对所述目标通道进行增强,得到目标卷积特征;第一目标检测模块,用于基于所述目标卷积特征,获取针对所述第一样本图片的目标检测结果;第一模型训练模块,用于确定所述第一样本图片的目标检测结果对应的第一损失值,基于所述第一损失值对所述第一目标检测模型进行训练,直至所述第一损失值达到第一预设损失阈值。9.根据权利要求8所述的方法,其中...

【专利技术属性】
技术研发人员:王云浩陈松张滨辛颖冯原王晓迪龙翔贾壮彭岩郑弘晖李超谷祎韩树民
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1