目标检测模型训练方法、模型性能检测方法及装置制造方法及图纸

技术编号:31484686 阅读:10 留言:0更新日期:2021-12-18 12:19
本发明专利技术公开了一种目标检测模型训练方法,其通过深度强化学习网络实现对区域的对焦,生成目标更容易检测的最优区域,并用所述最优区域生成训练效果更好的混合训练样本,以通过所述混合训练样本训练目标检测模型,其能够使得不同的目标对象能够自适应调整到目标检测模型容易学习的尺度来进行训练,提升了目标检测模型的检测性能。相应地,本发明专利技术还提供一种目标检测模型装置、目标检测模型性能检测方法及装置。装置。装置。

【技术实现步骤摘要】
目标检测模型训练方法、模型性能检测方法及装置


[0001]本专利技术涉及人工智能
,尤其涉及一种目标检测模型训练方法、模型性能检测方法及装置。

技术介绍

[0002]在深度学习时代,目标检测可以分为两类,单阶段目标检测和两阶段目标检测。
[0003]单阶段目标检测算法是直接对预定义的锚框进行分类,并通过检测头进一步细化回归它们,而无需生成建议区域。单阶段目标检测算法中,EfficientDet设计了一种加权双向特征金字塔网络,实现了简单快速的多尺度特征融合。EfficientDet还提出了一种复合缩放方法,该方法在统一的位置和分类框架内均匀缩放分辨率、深度和宽度。
[0004]两阶段目标检测算法通常首先生成一组区域建议,然后通过卷积神经网络对其进行细化。例如,faster R

CNN是用共享同一特征图并生成一系列目标锚框的区域建议网络设计的。
[0005]但是,本专利技术人在实施上述技术的过程中发现,无论是单阶段目标检测算法还是两阶段目标检测算法,均不能将不同目标对象自适应调整到检测器容易学习的尺度来进行训练。

技术实现思路

[0006]本专利技术提供一种目标检测模型的训练方法、模型性能检测方法及装置,以解决现有的目标检测算法不能自适应调整目标区域尺度的技术问题。
[0007]本专利技术第一方面提供一种目标检测模型的训练方法,包括:
[0008]对训练图片集中第一类训练图片上的所有目标标注框进行聚类,得到多个初始区域;其中,所述训练图片集中包含第一类训练图片和第二类训练图片,所述第一类训练图片标注有目标标注框;
[0009]将所述初始区域输入到深度强化学习网络中训练并进行区域调整操作,得到每一所述初始区域调整后的最优区域;
[0010]基于所述最优区域和所述训练图片集,得到混合训练样本;
[0011]采用所述混合训练样本对待训练的目标检测模型训练,得到训练后的目标检测模型。
[0012]作为上述方案的改进,所述将所述初始区域输入到深度强化学习网络中训练并执行区域的调整操作,得到每一所述初始区域调整后的最优区域,具体包括:
[0013]对于每一所述初始区域,将所述初始区域框选出的图片区域从对应的第一类训练图片裁剪出来,得到包含有子目标标注框的第一子图;
[0014]对所述第一子图进行目标检测,得到检测框,并根据所述检测框和所述子目标标注框的交并比,得到评测结果并保存所述评测结果;
[0015]将所述初始区域输入到深度强化学习网络中,输出预设数量的Q值,并取最大Q值
对应的操作对所述初始区域进行调整,得到调整后的初始区域;其中,每一所述Q值对应于对所述初始区域的其中一种操作下的作用结果;
[0016]对每一次调整后的初始区域进行评测,得到调整后的评测结果;
[0017]将第N次的评测结果和第N

1次的评测结果的差值作为奖励参数,其中,N≥2;
[0018]利用所述奖励参数对所述目标群区域不断迭代调整,直到满足迭代条件为止,输出最优区域,并得到训练后的深度强化学习网络。
[0019]作为上述方案的改进,所述对含有目标标注框的第一类训练图片上的所有目标标注框进行聚类,得到训练图片的多个初始区域,具体包括:
[0020]对第一类训练图片的所有目标标注框采用K

means聚类,获得M个目标群区域,其中,M≥1;
[0021]将所述目标群区域向外扩充预设像素的距离,得到初始区域。
[0022]作为上述方案的改进,所述基于所述最优区域和所述训练图片集,得到混合训练样本,具体包括:
[0023]对于每一所述最优区域,将所述最优区域框选出的图片区域从对应的第一类训练图片中裁剪出来,得到第二子图;
[0024]当检测到所述第一类训练图片的目标标注框与所述第二子图的区域重叠部分大于预设重叠面积时,将所述第一类训练图片的目标标注框的位置偏移预设距离,得到子标注框,并将所述子标注框标注到所述第二子图的标注框中,得到更新标注后的第二子图;
[0025]将所述更新标注后的第二子图、所述第一类训练图片和所述第二类训练图片作为混合训练样本。
[0026]本专利技术第二方面相应提供一种目标检测模型训练装置,包括:
[0027]初始区域获取模块,用于对训练图片集中第一类训练图片上的所有目标标注框进行聚类,得到多个初始区域;其中,所述训练图片集中包含第一类训练图片和第二类训练图片,所述第一类训练图片标注有目标标注框;
[0028]最优区域获取模块,用于将所述初始区域输入到深度强化学习网络中训练并进行区域调整操作,得到每一所述初始区域调整后的最优区域;
[0029]混合训练样本获取模块,用于基于所述最优区域和所述训练图片集,得到混合训练样本;
[0030]目标检测模型训练模块,用于采用所述混合训练样本对待训练的目标检测模型训练,得到训练后的目标检测模型。
[0031]作为上述方案的改进,所述最优区域获取模块,具体用于:
[0032]对于每一所述初始区域,将所述初始区域框选出的图片区域从对应的第一类训练图片裁剪出来,得到包含有子目标标注框的第一子图;
[0033]对所述第一子图进行目标检测,得到检测框,并根据所述检测框和所述子目标标注框的交并比,得到评测结果并保存所述评测结果;
[0034]将所述初始区域输入到深度强化学习网络中,输出预设数量的Q值,并取最大Q值对应的操作对所述初始区域进行调整,得到调整后的初始区域;其中,每一所述Q值对应于对所述初始区域的其中一种操作下的作用结果;
[0035]对每一次调整后的初始区域进行评测,得到调整后的评测结果;
[0036]将第N次的评测结果和第N

1次的评测结果的差值作为奖励参数,其中,N≥2;
[0037]利用所述奖励参数对所述目标群区域不断迭代调整,直到满足迭代条件为止,输出最优区域,并得到训练后的深度强化学习网络。
[0038]作为上述方案的改进,所述初始区域获取模块,具体用于:
[0039]对第一训练图片的所有目标标注框采用K

means聚类,获得M个目标群区域,其中,M≥1;
[0040]将所述目标群区域向外扩充预设像素的距离,得到初始区域。
[0041]作为上述方案的改进,所述混合训练样本获取模块,具体用于:
[0042]对于每一所述最优区域,将所述最优区域框选出的图片区域从对应的第一类训练图片中裁剪出来,得到第二子图;
[0043]当检测到所述第一类训练图片的目标标注框与所述第二子图的区域重叠部分大于预设重叠面积时,将所述第一类训练图片的目标标注框的位置偏移预设距离,得到子标注框,并将所述子标注框标注到所述第二子图的标注框中,得到更新标注后的第二子图;
[0044]将所述更新标注后的第二子图、所述第一类训练图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型训练方法,其特征在于,包括:对训练图片集中第一类训练图片上的所有目标标注框进行聚类,得到多个初始区域;其中,所述训练图片集中包含第一类训练图片和第二类训练图片,所述第一类训练图片标注有目标标注框;将所述初始区域输入到深度强化学习网络中训练并进行区域调整操作,得到每一所述初始区域调整后的最优区域;基于所述最优区域和所述训练图片集,得到混合训练样本;采用所述混合训练样本对待训练的目标检测模型训练,得到训练后的目标检测模型。2.如权利要求1所述的目标检测模型训练方法,其特征在于,所述将所述初始区域输入到深度强化学习网络中训练并执行区域的调整操作,得到每一所述初始区域调整后的最优区域,具体包括:对于每一所述初始区域,将所述初始区域框选出的图片区域从对应的第一类训练图片裁剪出来,得到包含有子目标标注框的第一子图;对所述第一子图进行目标检测,得到检测框,并根据所述检测框和所述子目标标注框的交并比,得到评测结果并保存所述评测结果;将所述初始区域输入到深度强化学习网络中,输出预设数量的Q值,并取最大Q值对应的操作对所述初始区域进行调整,得到调整后的初始区域;其中,每一所述Q值对应于对所述初始区域的其中一种操作下的作用结果;对每一次调整后的初始区域进行评测,得到调整后的评测结果;将第N次的评测结果和第N

1次的评测结果的差值作为奖励参数,其中,N≥2;利用所述奖励参数对所述目标群区域不断迭代调整,直到满足迭代条件为止,输出最优区域,并得到训练后的深度强化学习网络。3.如权利要求1所述的目标检测模型训练方法,其特征在于,所述对含有目标标注框的第一类训练图片上的所有目标标注框进行聚类,得到训练图片的多个初始区域,具体包括:对含有目标标注框的第一类训练图片上的所有目标标注框采用K

means聚类,获得M个目标群区域,其中,M≥1;将所述目标群区域向外扩充预设像素的距离,得到初始区域。4.如权利要求1所述的目标检测模型训练方法,其特征在于,所述基于所述最优区域和所述训练图片集,得到混合训练样本,具体包括:对于每一所述最优区域,将所述最优区域框选出的图片区域从对应的第一类训练图片中裁剪出来,得到第二子图;当检测到所述第一类训练图片的目标标注框与所述第二子图的区域重叠部分大于预设重叠面积时,将所述第一类训练图片的目标标注框的位置偏移预设距离,得到子标注框,并将所述子标注框标注到所述第二子图的标注框中,得到更新标注后的第二子图;将所述更新标注后的第二子图、所述第一类训练图片和所述第二类训练图片作为混合训练样本。5.一种目标检测模型训练装置,其特征在于,包括:初始区域获取模块,用于对训练图片集中第一类训练图片上的所有目标标注框进行聚类,得到多个初始区域;其中,所述训练图片集中包含第一类训练图片和第二类训练图片,
所述第一类训练图片标注有目标标注框;最优区域获取模块,用于将所述初始区域输入到深度强化学习网络中训练并进行区域调整操作,得到每一所述初始区域调整后的最优区域;混合训练样本获取模块,用于基于所述最优区域和所述训练图片集,得到混合训练样本;目标检测模型训练模块,用于采用所述混合训练样本对待训练的目标检测模型训练,得到训练后的目标检测模型。6.如权利要求5所述的目标检测模型训练装置,其特征在于,所述最优区域获取模块,具体用于:对于每一所述初始区域,将所述初始区域框选出的图片区域从对应的第一类训练图片裁剪出来,得到包含有子目标标注框的第一子图;对所述第一子图进行目标检测,得到检测框,并根据所述检测框和所述子目标标注框的交并比,得到评测结果并保存所述评测...

【专利技术属性】
技术研发人员:谢雪梅张裕博李旭阳石光明
申请(专利权)人:西安电子科技大学广州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1