目标检测模型的训练、目标检测方法、装置、设备和介质制造方法及图纸

技术编号:31797333 阅读:12 留言:0更新日期:2022-01-08 10:57
本公开提供了目标检测模型的训练、目标检测方法、装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于3D视觉场景下。具体实现方案为:获取样本图像,所述样本图像标注有困难区域;将所述样本图像输入至第一目标检测模型中,计算所述困难区域对应的第一损失;增大所述第一损失,并根据增大的第一损失训练所述第一目标检测模型。本公开实施例可以提高目标检测的准确率,降低目标检测的成本。检测的成本。检测的成本。

【技术实现步骤摘要】
目标检测模型的训练、目标检测方法、装置、设备和介质


[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于3D视觉场景下,尤其涉及目标检测模型的训练、目标检测方法、装置、设备和介质。

技术介绍

[0002]计算机视觉技术正是想要赋予计算机人类的视觉识别和定位的功能。通过复杂的图像计算,计算机能够识别和定位出目标对象。
[0003]3D目标检测主要是检测3D物体,其中,3D物体通常以空间坐标(x,y,z)、尺寸大小(长,宽,高)和朝向角等参数表示。

技术实现思路

[0004]本公开提供了一种目标检测模型的训练、目标检测方法、装置、设备和介质。
[0005]根据本公开的一方面,提供了一种目标检测模型的训练方法,包括:
[0006]获取样本图像,所述样本图像标注有困难区域;
[0007]将所述样本图像输入至第一目标检测模型中,计算所述困难区域对应的第一损失;
[0008]增大所述第一损失,并根据增大的第一损失训练所述第一目标检测模型。
[0009]根据本公开的一方面,还提供了一种目标检测方法,包括:
[0010]将图像输入至目标检测模型中,在所述图像中识别3D目标空间,以及所述3D目标空间的目标类别;
[0011]其中,所述目标检测模型是根据如本公开任一项实施例所述的目标检测模型的训练方法训练得到。
[0012]根据本公开的一方面,提供了一种目标检测模型的训练装置,包括:
[0013]样本图像获取模块,用于获取样本图像,所述样本图像标注有困难区域;
[0014]空间损失计算模块,用于将所述样本图像输入至第一目标检测模型中,计算所述困难区域对应的第一损失;
[0015]空间损失调整模块,用于增大所述第一损失,并根据增大的第一损失训练所述第一目标检测模型。
[0016]根据本公开的一方面,还提供了一种目标检测模型的训练装置,包括:
[0017]3D目标检测模块,用于将图像输入至目标检测模型中,在所述图像中识别3D目标空间,以及所述3D目标空间的目标类别;其中,所述目标检测模型是根据如本公开任一项实施例所述的目标检测模型的训练方法训练得到。
[0018]根据本公开的另一方面,提供了一种电子设备,包括:
[0019]至少一个处理器;以及
[0020]与所述至少一个处理器通信连接的存储器;其中,
[0021]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一
个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的目标检测模型的训练方法,或执行本公开任一实施例所述的目标检测方法。
[0022]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所述的目标检测模型的训练方法,或执行本公开任一实施例所述的目标检测方法。
[0023]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任一实施例所述的目标检测模型的训练方法,或执行本公开任一实施例所述的目标检测方法。
[0024]本公开实施例可以提高目标检测的准确率,降低目标检测的成本。
[0025]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0027]图1是根据本公开实施例提供的一种目标检测模型的训练方法的示意图;
[0028]图2是根据本公开实施例提供的一种目标检测模型的训练方法的示意图;
[0029]图3是根据本公开实施例提供的交并比的示意图;
[0030]图4是根据本公开实施例提供的一种目标检测模型的训练方法的示意图;
[0031]图5是根据本公开实施例提供的一种目标检测模型的训练场景图;
[0032]图6是根据本公开实施例提供的一种目标检测方法的示意图;
[0033]图7是根据本公开实施例提供的一种目标检测模型的训练装置的示意图;
[0034]图8是根据本公开实施例提供的一种目标检测装置的示意图;
[0035]图9是用来实现本公开实施例的目标检测模型的训练方法或目标检测方法的电子设备的示意图。
具体实施方式
[0036]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0037]图1是根据本公开实施例公开的一种目标检测模型的训练方法的流程图,本实施例可以适用于对用于实现3D目标检测的目标检测模型进行训练的情况。本实施例方法可以由目标检测模型的训练装置来执行,该装置可采用软件和/或硬件的方式实现,并具体配置于具有一定数据运算能力的电子设备中,该电子设备可以是客户端设备或服务器设备,客户端设备例如手机、平板电脑、车载终端和台式电脑等。
[0038]S101,获取样本图像,所述样本图像标注有困难区域。
[0039]样本图像用于训练目标检测模型,样本图像为单目2D图像,单目是指一个角度拍摄的图像,该样本图像不具有深度信息。可以是图像采集模块对设定场景环境进行采集得到的图像,例如,可以是车辆上的摄像头对前方路况进行采集得到的图像。
[0040]困难区域是指第一目标检测模型预测效果差的困难3D物体投影在平面上形成的区域。预测效果用于确定第一目标检测模型是否能够准确预测3D物体。3D物体可以通过空间关键点坐标、空间长、空间宽、空间高和空间朝向角等属性信息表示。第一目标检测模型输出的第一检测结果表示一个3D物体,不同第一检测结果对应不同3D物体,相应可以定义第一目标检测模型的第一检测结果为N
A
×
D,其中,D={LWH,XYZ,ry}是一个7维的检测结果,L为长,W为宽,H为高,以及XYZ为(物体)中心点坐标,ry为朝向角。N为检测的第一检测结果的数量,N
A
表示第A个第一检测结果。将一个第一检测结果经过相机内参投影到2D图像上,可以得到8个投影点,8个投影点的外接区域,确定为第一检测区域。其中,外接区域可以是外接矩形。
[0041]在目标检测模型的训练过程中,通常配置有作为真值的3D物体,确定为标准3D物体,标准3D物体用于验证第一检测结果是否正确。将该标准3D物体投影到2D图像中,得到8个投影点,将8个投影点的外接区域,确定为该标准3D物体的标准区域。困难3D物体为对标准3D物体进行分类得到的一个类型的3D物体,困难3D物体投影在2D图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,包括:获取样本图像,所述样本图像标注有困难区域;将所述样本图像输入至第一目标检测模型中,计算所述困难区域对应的第一损失;增大所述第一损失,并根据增大的第一损失训练所述第一目标检测模型。2.根据权利要求1所述的方法,其中,所述获取样本图像,包括:获取初始图像,所述初始图像标注有标准区域;将所述初始图像输入至所述第一目标检测模型,得到第一检测区域;根据各所述标准区域和各所述第一检测区域,对各所述标准区域进行分类,确定困难区域;根据所述困难区域和所述初始图像,确定样本图像。3.根据权利要求2所述的方法,还包括:将所述初始图像输入至第二目标检测模型,得到第二检测区域;所述根据各所述标准区域和各所述第一检测区域,对各所述标准区域进行分类,确定困难区域,包括:根据各所述标准区域、各所述第一检测区域和各所述第二检测区域,对各所述标准区域进行分类,确定困难区域。4.根据权利要求3所述的方法,其中,所述根据各所述标准区域、各所述第一检测区域和各所述第二检测区域,对各所述标准区域进行分类,确定困难区域,包括:计算各所述标准区域与各所述第一检测区域之间的相似值,并进行区域筛选,得到第一筛选区域集合;计算各所述标准区域与各所述第二检测区域之间的相似值,并进行区域筛选,得到第二筛选区域集合;计算各所述第一检测区域与各所述第二检测区域之间的相似值,并进行区域筛选,得到第三筛选区域集合;根据所述第二筛选区域集合和所述第三筛选区域集合,确定相同区域集合;获取属于所述相同区域集合且不属于所述第一筛选区域集合的标准区域,并确定为困难区域。5.根据权利要求1所述的方法,还包括:将所述样本图像输入至所述第一目标检测模型中,计算所述困难区域对应的第一置信度;将所述样本图像输入至第二目标检测模型中,计算所述困难区域对应的第二置信度;根据所述第一置信度和所述第二置信度,计算置信度一致性损失;所述根据增大的第一损失,训练所述第一目标检测模型,包括:根据增大的第一损失和所述置信度一致性损失,训练所述第一目标检测模型。6.根据权利要求1所述的方法,其中,所述样本图像标注有简单区域;所述方法,包括:将所述样本图像输入至第一目标检测模型中,计算所述简单区域的第二损失;所述根据增大的第一损失训练所述第一目标检测模型,包括:根据增大的第一损失和所述第二损失,训练所述第一目标检测模型。
7.一种目标检测方法,包括:将图像输入至目标检测模型中,在所述图像中识别3D目标空间,以及所述3D目标空间的目标类别;其中,所述目标检测模型是根据如权利要求1至6中任一项所述的目标检测模型的训练方法训练得到。8.一种目标检测模型的训练装置,包括:样本图像获取模块,用于获取样本图像,所述样本图像标注有困难区域;空间损失计算模块,用于将所述样本图像输入至第一目标检测模型中,计算所述困难区域对应的第一损失;空间损失调整模块,用于增大所述第一损失,并根据增大的第一损失训练所述第一目标检测模型。9.根据权利要求8所述的装置,其中,所述样本图像获取模块,包括:初始图像获取单元,用于获取初始图像,所述初始图像标注有标准区域;第一检测区域获取单元,用于将所述初始图像输入至所述第一目标检测模型,得到第一检测区域;标准区域分类单元,用于根据各所...

【专利技术属性】
技术研发人员:叶晓青孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1