目标检测模型的训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28321975 阅读:25 留言:0更新日期:2021-05-04 13:02
本申请涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取样本图像及样本图像中多个目标对应的标注框;通过目标检测模型对样本图像进行目标检测,获得样本图像中多个目标对应的预测框;根据目标所对应的预测框与标注框之间的差异确定第一损失;根据样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失;根据样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失度;根据第一损失、第二损失及第三损失调整目标检测模型的模型参数后,返回获取样本图像及样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型,本申请提供的方案能够提升图像中目标较为拥挤时的检测效果。

【技术实现步骤摘要】
目标检测模型的训练方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。
技术介绍
目标检测是计算机视觉领域的图像处理技术,目标检测可以从图像中定位出目标。在目标检测任务中,通常会对目标检测出多个预测框,在进行目标检测时,对于输出的多个预测框,可以采用非极大值抑制(NonMaximumSuppression,NMS)技术进行后处理,去除多余的预测框之后得到各个目标对应的最终检测结果。专利技术人发现,传统的目标检测算法主要是根据各个预测框与标注框之间的差异来进行网络训练的,没有将上述的后处理过程加入到训练过程中,导致在检测目标较为拥挤的图像时,采用NMS算法对输出的多个预测框进行后处理得到的检测结果存在漏掉了正确的预测框、保留了错误的预测框的问题,检测效果不太理想。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够在图像中目标较为拥挤的场景下提升检测效果的目标检测模型的训练方法、装置、计算机设备和存储介质。一种目标检测模型的训练方法,所述方法包括:获取样本图像及所述样本图像中多个目标对应的标注框;通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,各所述目标对应的预测框的数量为至少一个;根据所述目标所对应的预测框与标注框之间的差异确定第一损失;根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。一种目标检测模型的训练装置,所述装置包括:获取模块,用于获取样本图像及所述样本图像中多个目标对应的标注框;检测模块,用于通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,各所述目标对应的预测框的数量为至少一个;第一损失确定模块,用于根据所述目标所对应的预测框与标注框之间的差异确定第一损失;第二损失确定模块,用于根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;第三损失确定模块,用于根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;调整模块,用于根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取样本图像及所述样本图像中多个目标对应的标注框;通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,所述目标对应的预测框的数量为至少一个;根据所述目标所对应的预测框与标注框之间的差异确定第一损失;根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取样本图像及所述样本图像中多个目标对应的标注框;通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,所述目标对应的预测框的数量为至少一个;根据所述目标所对应的预测框与标注框之间的差异确定第一损失;根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。上述目标检测模型的训练方法、装置、计算机设备和存储介质,在训练过程中,不仅通过第一损失考虑了预测框与标注框之间的差异,还考虑了相同目标之间的重叠程度以及不同目标之间的重叠程度,其中,第二损失用于增大相同目标所对应的预测框之间的重叠程度,能够解决拥挤场景中保留了相同目标的多余预测框的问题,第三损失用于减小不同目标所对应的预测框之间的重叠程度,能够解决拥挤场景中漏掉了不同目标正确的预测框的问题。这样,通过第一损失、第二损失和第三损失调整模型参数得到的目标检测模型,能够拉近相同目标对应的多个预测框,重叠面积会变大,从而减少采用极大值抑制技术进行后处理时的误检,还能够推远不同目标对应的预测框,重叠面积会变小,从而减少采用极大值抑制技术进行后处理时的漏检,有效提升了检测效果。附图说明图1为一个实施例中目标检测模型的训练方法的应用环境图;图2为一个实施例中对目标检测模型进行训练的示意图;图3为一个实施例中采用目标检测模型进行目标检测的示意图;图4为一个实施例中目标检测模型的训练方法的流程示意图;图5为一个实施例中根据样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失的流程示意图;图6为一个实施例中将对应同一目标的预测框拉近的示意图;图7为一个实施例中根据样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失的流程示意图;图8为一个实施例中将不同目标的预测框推远的示意图;图9为一个实施例中目标检测模型的训练装置的结构框图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。...

【技术保护点】
1.一种目标检测模型的训练方法,所述方法包括:/n获取样本图像及所述样本图像中多个目标对应的标注框;/n通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,所述目标对应的预测框的数量为至少一个;/n根据所述目标所对应的预测框与标注框之间的差异确定第一损失;/n根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;/n根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;/n根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。/n

【技术特征摘要】
1.一种目标检测模型的训练方法,所述方法包括:
获取样本图像及所述样本图像中多个目标对应的标注框;
通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,所述目标对应的预测框的数量为至少一个;
根据所述目标所对应的预测框与标注框之间的差异确定第一损失;
根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度;
根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度;
根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后,返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练,直至获得训练好的目标检测模型。


2.根据权利要求1所述的方法,其特征在于,所述通过目标检测模型对所述样本图像进行目标检测,获得所述样本图像中多个目标对应的预测框,包括:
将所述样本图像输入至目标检测模型;
通过所述目标检测模型中的特征提取网络,对所述样本图像进行特征提取,获得所述样本图像对应的图像特征;
通过所述目标检测模型中的分类回归层,根据所述图像特征获得所述样本图像中多个目标对应的预测框。


3.根据权利要求1所述的方法,其特征在于,所述根据所述目标所对应的预测框与标注框之间的差异确定第一损失,包括:
获取所述目标对应的各个预测框的预测坐标信息;
获取所述目标对应的标注框的真实坐标信息;
根据所述预测坐标信息与相应真实坐标信息之间的差异确定第一损失。


4.根据权利要求1所述的方法,其特征在于,所述根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失,包括:
按照所对应的目标将预测框划分,得到每个目标对应的预测框集合;
迭代执行将当前目标对应的预测框集合中置信度最大的预测框作为当前目标对应的匹配预测框,将所述当前目标对应的预测框集合中的其他预测框依次作为当前处理框,根据所述当前处理框与所述匹配预测框之间的第一重叠程度计算所述当前处理框与所述匹配预测框之间的拉近损失之后,从所述预测框集合中剔除所述匹配预测框的步骤,直至所述当前目标对应的预测框集合为空;
融合各所述当前处理框与匹配预测框之间的拉近损失,得到用于增大所述当前目标所对应的预测框之间的重叠程度的第二损失。


5.根据权利要求4所述的方法,其特征在于,所述当前处理框与所述匹配预测框之间的拉近损失与所述第一重叠程度成反相关,且与所述当前处理框对应的置信度成正相关。


6.根据权利要求4所述的方法,其特征在于,所述当前处理框与所述匹配预测框之间的拉近损失通过以下公式确定:
Loss_pull(b,bmax)=-ln(1-N+IoU(b,bmax))*s;
其中,bmax表示当前目标对应的匹配预测框,b表示所述当前处理框,IoU(b,bmax)表示所述当前处理框b与所述匹配预测框bmax之间的第一重叠程度,N表示用于进行非极大值抑制处理的预设阈值,s表示所述当前处理框b的置信度,ln表示指数函数,Loss_pull(b,bmax)表示所述当前处理框b与所述匹配预测框bmax之间的拉近损失。


7.根据权利要求1所述的方法,其特征在于,所述根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失,包括:
根据所述目标对应的预测框,获得全量预测框集合;
迭代执行将所述全量预测框集合中置信度最大的预测框,作为当前处理框;遍历所述全量预测框集合中与所述当前处理框之间的第二重叠程度大于预设阈值的预测框;当遍历的预测框与所述当前处理框对应不同目标时,则根据所述当前处理框与所述遍历的预测框之间的第二重叠程度计算所述当前处理框与所述遍历的...

【专利技术属性】
技术研发人员:罗泽坤王亚彪李剑王昌安彭瑾龙汪铖杰李季檩方正
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1