目标检测模型训练及目标检测方法、装置、设备和介质制造方法及图纸

技术编号:38147880 阅读:7 留言:0更新日期:2023-07-13 09:11
本公开提供了一种目标检测模型训练及目标检测方法、装置、设备和介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习等技术领域。所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述训练方法包括:获取训练数据;采用所述特征提取网络,获得所述训练数据中图像样本的图像特征;基于所述图像特征和各个辅助预测网络,获得辅助预测结果;基于所述辅助预测结果、所述训练数据中的真实结果和目标匹配关系,构建子损失函数,其中,所述目标匹配关系是基于所述多个辅助预测网络共用的初始匹配关系确定的;基于所述子损失函数,构建总损失函数,并采用所述总损失函数调整模型参数。本公开可以提高目标检测精度。本公开可以提高目标检测精度。本公开可以提高目标检测精度。

【技术实现步骤摘要】
目标检测模型训练及目标检测方法、装置、设备和介质


[0001]本公开涉及人工智能
,具体涉及计算机视觉、深度学习等
,尤其涉及一种目标检测模型训练及目标检测方法、装置、设备和介质。

技术介绍

[0002]目标检测是计算机视觉领域中的一个重要研究方向,也是其他复杂视觉任务的基础。
[0003]如何提高目标检测精度是需要解决的问题。

技术实现思路

[0004]本公开提供了一种目标检测模型训练及目标检测方法、装置、设备和介质。
[0005]根据本公开的一方面,提供了一种目标检测模型的训练方法,所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述方法包括:获取训练数据,所述训练数据包括:图像样本和所述图像样本中目标的真实结果;采用所述特征提取网络,对所述图像样本进行特征提取处理,以获得所述图像样本的图像特征;基于所述图像特征和所述多个辅助预测网络中各个辅助预测网络,获得所述各个辅助预测网络对应的所述目标的辅助预测结果;针对所述各个辅助预测网络,基于所述辅助预测结果、所述真实结果和目标匹配关系,构建所述各个辅助预测网络对应的子损失函数,其中,所述目标匹配关系是基于所述多个辅助预测网络共用的初始匹配关系确定的;基于所述各个辅助预测网络对应的子损失函数,构建总损失函数,并采用所述总损失函数调整所述目标检测模型的模型参数。
[0006]根据本公开的另一方面,提供了一种目标检测方法,包括:获取图像;采用目标检测模型,对所述图像进行处理,以获得所述图像中目标的检测结果;其中,所述目标检测模型采用上述任一方面的任一项所述的训练方法得到的。
[0007]根据本公开的另一方面,提供了一种目标检测模型的训练装置,所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述装置包括:获取模块,用于获取训练数据,所述训练数据包括:图像样本和所述图像样本中目标的真实结果;特征提取模块,用于采用所述特征提取网络,对所述图像样本进行特征提取处理,以获得所述图像样本的图像特征;辅助预测模块,用于基于所述图像特征和所述多个辅助预测网络中各个辅助预测网络,获得所述各个辅助预测网络对应的所述目标的辅助预测结果;辅助构建模块,用于针对所述各个辅助预测网络,基于所述辅助预测结果、所述真实结果和目标匹配关系,构建所述各个辅助预测网络对应的子损失函数,其中,所述目标匹配关系是基于所述多个辅助预测网络共用的初始匹配关系确定的;调整模块,用于基于所述各个辅助预测网络对应的子损失函数,构建总损失函数,并采用所述总损失函数调整所述目标检测模型的模型参数。
[0008]根据本公开的另一方面,提供了一种目标检测装置,包括:获取模块,用于获取图像;检测模块,用于采用目标检测模型,对所述图像进行处理,以获得所述图像中目标的检测结果;其中,所述目标检测模型采用上述任一方面的任一项所述的训练方法得到的。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。
[0012]根据本公开的技术方案,可以提高目标检测精度。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开第一实施例的示意图;
[0016]图2是根据本公开实施例提供的应用场景的示意图;
[0017]图3是根据本公开实施例提供的目标检测模型的结构示意图;
[0018]图4是根据本公开实施例提供的多个预测网络的结构示意图;
[0019]图5是根据本公开实施例提供的初始匹配关系的获取流程示意图;
[0020]图6是根据本公开第二实施例的示意图;
[0021]图7是根据本公开第三实施例的示意图;
[0022]图8是根据本公开第四实施例的示意图;
[0023]图9是根据本公开第五实施例的示意图;
[0024]图10是用来实现本公开实施例的目标检测模型训练方法或目标检测方法的电子设备的示意图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]图1是根据本公开第一实施例的示意图,本实施例提供一种目标检测模型的训练方法,所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述方法包括:
[0027]101、获取训练数据,所述训练数据包括:图像样本和所述图像样本中目标的真实结果。
[0028]102、采用所述特征提取网络,对所述图像样本进行特征提取处理,以获得所述图像样本的图像特征。
[0029]103、基于所述图像特征和所述多个辅助预测网络中各个辅助预测网络,获得所述
各个辅助预测网络对应的所述目标的辅助预测结果。
[0030]104、针对所述各个辅助预测网络,基于所述辅助预测结果、所述真实结果和目标匹配关系,构建所述各个辅助预测网络对应的子损失函数,其中,所述目标匹配关系是基于所述多个辅助预测网络共用的初始匹配关系确定的。
[0031]105、基于所述各个辅助预测网络对应的子损失函数,构建总损失函数,并采用所述总损失函数调整所述目标检测模型的模型参数。
[0032]其中,图像样本可以是已有的图像集中的图像,可以采用人工或其他方式对图像样本进行标注,获取图像样本中目标的真实结果。
[0033]图像样本中可以包括一个或多个目标,以多个目标为例,各个目标的真实结果可以用Y1、Y2、Y3....表示。每个目标的真实结果可以包括位置信息(box)和类别信息(class)。
[0034]特征提取网络可以是通常是卷积神经网络(ConvolutionalNeural Network,CNN),具体如残差(Resnet)系列网络。
[0035]特征提取网络的输入是图像样本,输出是图像样本的图像特征。图像特征可以是单一尺度的图像特征,或者,还可以是多尺度的图像特征,例如,多尺度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述方法包括:获取训练数据,所述训练数据包括:图像样本和所述图像样本中目标的真实结果;采用所述特征提取网络,对所述图像样本进行特征提取处理,以获得所述图像样本的图像特征;基于所述图像特征和所述多个辅助预测网络中各个辅助预测网络,获得所述各个辅助预测网络对应的所述目标的辅助预测结果;针对所述各个辅助预测网络,基于所述辅助预测结果、所述真实结果和目标匹配关系,构建所述各个辅助预测网络对应的子损失函数,其中,所述目标匹配关系是基于所述多个辅助预测网络共用的初始匹配关系确定的;基于所述各个辅助预测网络对应的子损失函数,构建总损失函数,并采用所述总损失函数调整所述目标检测模型的模型参数。2.根据权利要求1所述的方法,还包括:基于所述图像特征,获得所述目标的初始预测结果;对所述初始预测结果和所述真实结果进行匹配处理,以获得所述初始匹配关系。3.根据权利要求2所述的方法,其中,所述目标检测模型还包括:编码器;所述基于所述图像特征,获得所述目标的初始预测结果,包括:采用所述编码器,对所述图像特征进行编码处理,以获得编码特征;对所述编码特征进行选择处理,以获得查询特征;基于所述查询特征,获得所述目标的初始预测结果。4.根据权利要求3所述的方法,其中,所述各个辅助预测网络包括:辅助解码器和辅助预测头;所述基于所述图像特征和所述多个辅助预测网络中各个辅助预测网络,获得所述各个辅助预测网络对应的所述目标的辅助预测结果,包括:针对所述各个辅助预测网络,采用所述辅助解码器,基于所述编码特征、所述查询特征和所述初始预测结果,获得所述各个辅助预测网络对应的解码特征;针对所述各个辅助预测网络,采用所述辅助预测头,对所述各个辅助预测网络对应的解码特征进行预测处理,以获得所述各个辅助预测网络对应的所述辅助预测结果。5.根据权利要求3所述的方法,其中,所述目标检测模块还包括:主预测网络;所述方法还包括:采用所述主预测网络,基于所述编码特征、所述查询特征和所述初始预测结果,获得所述主预测网络对应的主预测结果;基于所述主预测结果,构建所述主预测网络对应的子损失函数;相应地,所述基于所述各个辅助预测网络对应的子损失函数,构建总损失函数,包括:基于所述各个辅助预测网络对应的子损失函数和所述主预测网络对应的子损失函数,构建所述总损失函数。6.根据权利要求5所述的方法,其中,
所述主预测网络包括:主解码器和主预测头;所述采用所述主预测网络,基于所述编码特征、所述查询特征和所述初始预测结果,获得所述主预测网络对应的主预测结果,包括:采用所述主解码器,基于所述编码特征、所述查询特征和所述初始预测结果,获得所述主预测网络对应的解码特征;采用所述主预测头,对所述主预测网络对应的解码特征进行预测处理,以获得所述主预测网络对应的主预测结果。7.根据权利要求5所述的方法,其中,所述基于所述主预测结果,构建所述主预测网络对应的子损失函数,包括:对所述主预测结果和所述真实结果进行匹配处理,以获得所述主预测结果与所述真实结果之间的主匹配关系;基于所述主预测结果、所述真实结果和所述主匹配关系,构建所述主预测网络对应的子损失函数。8.一种目标检测方法,包括:获取图像;采用目标检测模型,对所述图像进行处理,以获得所述图像中目标的检测结果;其中,所述目标检测模型采用如权利要求1

7中任一项所述的训练方法得到。9.一种目标检测模型的训练装置,所述目标检测模型包括:特征提取网络和多个辅助预测网络,所述装置包括:获取模块,用于获取训练数据,所述训练数据包括:图像样本和所述图像样本中目标的真实结果;特征提取模块,用于采用所述特征提取网络,对所述图像样本...

【专利技术属性】
技术研发人员:吕文玉徐尚良赵祎安魏金满王冠中党青青
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1