训练方法、目标检测方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:31797633 阅读:13 留言:0更新日期:2022-01-08 10:57
本公开提供了一种训练方法、目标检测方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:将第一样本图像和第二样本图像输入第一预设模型,得到与第一样本图像对应的第一特征图和与第二样本图像对应的第二特征图;将第三样本图像和第四样本图像输入第二预设模型,得到与第三样本图像对应的第三特征图和与第四样本图像对应的第四特征图;基于第一对比损失函数,利用第一特征图、第二特征图、第三特征图和第四特征图,调整第一预设模型的模型参数,直至满足预设条件,其中,第二预设模型的模型参数的数值与第一预设模型的模型参数的数值相同;将在满足预设条件的情况下得到的第一预设模型确定为检测模型。下得到的第一预设模型确定为检测模型。下得到的第一预设模型确定为检测模型。

【技术实现步骤摘要】
训练方法、目标检测方法、装置、电子设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及计算机视觉和深度学习技术。具体地,涉及一种训练方法、目标检测方法、装置、电子设备以及存储介质。

技术介绍

[0002]目标检测是计算机视觉领域较为基础的任务,其在智能安防、智慧交通和人机交互等领域有广泛的应用。
[0003]目标检测可以指从图像中分离出感兴趣的对象,并确定对象的类别和位置。

技术实现思路

[0004]本公开提供了一种训练方法、目标检测方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种检测模型的训练方法,包括:将第一样本图像和第二样本图像输入第一预设模型,得到与上述第一样本图像对应的第一特征图和与上述第二样本图像对应的第二特征图;将第三样本图像和第四样本图像输入第二预设模型,得到与上述第三样本图像对应的第三特征图和与上述第四样本图像对应的第四特征图,其中,上述第一样本图像和上述第三样本图像是正样本图像对,上述第二样本图像和上述第四样本图像是负样本图像对;基于第一对比损失函数,利用上述第一特征图、上述第二特征图、上述第三特征图和上述第四特征图,调整上述第一预设模型的模型参数,直至满足预设条件,其中,上述第二预设模型的模型参数的数值与上述第一预设模型的模型参数的数值相同;以及,将在满足上述预设条件的情况下得到的第一预设模型确定为上述检测模型。
[0006]根据本公开的另一方面,提供了一种目标检测方法,包括:将待处理图像输入检测模型,得到上述待处理图像包括的每个对象的类别和位置,其中,上述检测模型是利用根据如上所述的方法训练的。
[0007]根据本公开的另一方面,提供了一种检测模型的训练装置,包括:第一获得模块,用于将第一样本图像和第二样本图像输入第一预设模型,得到与上述第一样本图像对应的第一特征图和与上述第二样本图像对应的第二特征图;第二获得模块,用于将第三样本图像和第四样本图像输入第二预设模型,得到与上述第三样本图像对应的第三特征图和与上述第四样本图像对应的第四特征图,其中,上述第一样本图像和上述第三样本图像是正样本图像对,上述第二样本图像和上述第四样本图像是负样本图像对;调整模块,用于基于第一对比损失函数,利用上述第一特征图、上述第二特征图、上述第三特征图和上述第四特征图,调整上述第一预设模型的模型参数,直至满足预设条件,其中,上述第二预设模型的模型参数的数值与上述第一预设模型的模型参数的数值相同;以及,确定模块,用于将在满足上述预设条件的情况下得到的第一预设模型确定为上述检测模型。
[0008]根据本公开的另一方面,提供了一种目标检测装置,包括:第七获得模块,用于将待处理图像输入检测模型,得到上述待处理图像包括的每个对象的类别和位置,其中,上述检测模型是利用根据如上所述的装置训练的。
[0009]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如上所述的方法。
[0010]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如上所述的方法。
[0011]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如上所述的方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1示意性示出了根据本公开实施例的可以应用检测模型的训练方法、目标检测方法及装置的示例性系统架构;
[0015]图2示意性示出了根据本公开实施例的检测模型的训练方法的流程图;
[0016]图3示意性示出了根据本公开实施例的检测模型的训练过程的原理示意图;
[0017]图4示意性示出了根据本公开实施例的检测模型的训练过程的示例示意图;
[0018]图5示意性示出了根据本公开实施例的目标检测方法的流程图;
[0019]图6示意性示出了根据本公开实施例的内容处理装置的框图;
[0020]图7示意性示出了根据本公开实施例的目标检测装置的框图;以及
[0021]图8示意性示出了根据本公开实施例的适于实现检测模型的训练方法和目标检测方法的电子设备的框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]可以利用基于样本图像集训练得到的检测模型实现目标检测。可以利用如下方式基于样本图像集训练检测模型,即,可以利用公开的样本图像集对预设模型进行预训练,得到预训练模型。再利用与场景对应的样本图像集对预训练模型进行微调,得到与场景对应的检测模型。
[0024]与场景对应的样本图像集可能较难以涵盖场景的所有情况,例如,环境的变化导致同一场景的样本图像的变化较大,环境的变化可以包括天气的变化和光线明暗的变化等。此外,鲁棒性较好的检测模型可以被部署在多个场景,但有些场景可能与样本图像集对应的场景有较大差别。因此,基于上述方式训练得到的检测模型可能出现各种bad case,导致检测模型需要反复训练和微调。上述方式耗时耗力,并且有可能在bad case的基础上进行微调之后,导致检测模型的性能不能满足需要。基于上述方式训练得到的检测模型的鲁
棒性较差。
[0025]为此,本公开实施例提供了一种提高检测模型的鲁棒性的方案,即,将第一样本图像和第二样本图像输入第一预设模型,得到与第一样本图像对应的第一特征图和与第二样本图像对应的第二特征图。将第三样本图像和第四样本图像输入第二预设模型,得到与第三样本图像对应的第三特征图和与第四样本图像对应的第四特征图。第一样本图像和第三样本图像是正样本图像对,第二样本图像和第四样本图像是负样本图像对。基于第一对比损失函数,利用第一特征图、第二特征图、第三特征图和第四特征图,调整第一预设模型的模型参数,直至满足预设条件。第二预设模型的模型参数的数值与第一预设模型的模型参数的数值相同。将在满足预设条件的情况下得到的第一预设模型确定为检测模型。
[0026]第一特征图和第三特征图是与正样本图像对对应的特征图,第二特征图和第四特征图是与负样本图像对对应的特征图,通过对比学习的方式,利用第一对比损失函数处理第一特征图、第二特征图、第三特征图和第四特征图,使得第一预设模型能够学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法,包括:将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;将第三样本图像和第四样本图像输入第二预设模型,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图,其中,所述第一样本图像和所述第三样本图像是正样本图像对,所述第二样本图像和所述第四样本图像是负样本图像对;基于第一对比损失函数,利用所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图,调整所述第一预设模型的模型参数,直至满足预设条件,其中,所述第二预设模型的模型参数的数值与所述第一预设模型的模型参数的数值相同;以及将在满足所述预设条件的情况下得到的第一预设模型确定为所述检测模型。2.根据权利要求1所述的方法,其中,所述基于第一对比损失函数,利用所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图,调整所述第一预设模型的模型参数,直至满足预设条件,包括:基于所述第一对比损失函数,利用所述第一特征和所述第三特征,得到第一输出值;基于所述第一对比损失函数,利用所述第二特征和所述第四特征,得到第二输出值;根据输出值调整所述第一预设模型的模型参数,直至输出值所述输出值收敛,其中,所述输出值包括所述第一输出值和所述第二输出值;以及将在所述输出值收敛情况下得到的第一预设模型确定为检测模型。3.根据权利要求2所述的方法,其中,所述输出值还包括第三输出值和第四输出值;所述方法还包括:将所述第一特征图和所述第二特征图分别输入所述第一预设模型,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;将所述第三特征图和所述第四特征图分别输入所述第二预设模型,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量;基于第二对比损失函数,利用所述第一实例向量和所述第三实例向量,得到所述第三输出值;以及基于所述第二对比损失函数,利用所述第二实例向量和所述第四实例向量,得到所述第四输出值。4.根据权利要求1~3中任一项所述的方法,其中,所述将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图,包括:将所述第一样本图像和所述第二样本图像分别输入所述第一预设模型的骨干网络,得到与所述第一样本图像对应的第一特征图和与所述第二样本图像对应的第二特征图;所述将第三样本图像和第四样本图像输入第二预设模型,得到与所述第三样本图像对应的第三特征图和与所述第四样本图像对应的第四特征图,包括:将所述第三样本图像和所述第四样本图像输入所述第二预设模型的骨干网络,得到与所述第三样本图像对应的第三特征和与所述第四样本图像对应的第四特征。
5.根据权利要求3所述的方法,其中,所述将所述第一特征图和所述第二特征图分别输入所述第一预设模型,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量,包括:将所述第一特征和所述第二特征分别输入所述第一预设模型的检测头,得到所述第一样本图像包括的每个对象的第一实例向量和所述第二样本图像包括的每个对象的第二实例向量;所述将所述第三特征图和所述第四特征图分别输入所述第二预设模型,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量,包括:将所述第三特征和所述第四特征分别输入所述第二预设模型的检测头,得到所述第三样本图像包括的每个对象的第三实例向量和所述第四样本图像包括的每个对象的第四实例向量。6.根据权利要求1~5中任一项所述的方法,其中,所述第二样本图像是利用数据增强方法处理所述第一样本图像得到的。7.一种目标检测方法,包括:将待处理图像输入检测模型,得到所述待处理图像包括的每个对象的类别和位置,其中,所述检测模型是利用根据权利要求1~6中任一项所述的方法训练的。8.一种检测模型的训练装置,包括:第一获得模块,用于将第一样本图像和第二样本图像输入第一预设模型,得到与所述第一样本图像对应...

【专利技术属性】
技术研发人员:谌强
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1