目标检测模型的训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：28321975 阅读：25 留言：0更新日期：2021-05-04 13:02

本申请涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。所述方法包括：获取样本图像及样本图像中多个目标对应的标注框；通过目标检测模型对样本图像进行目标检测，获得样本图像中多个目标对应的预测框；根据目标所对应的预测框与标注框之间的差异确定第一损失；根据样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失；根据样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失度；根据第一损失、第二损失及第三损失调整目标检测模型的模型参数后，返回获取样本图像及样本图像中多个目标对应的标注框的步骤继续训练，直至获得训练好的目标检测模型，本申请提供的方案能够提升图像中目标较为拥挤时的检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测模型的训练方法、装置、计算机设备和存储介质
本申请涉及计算机
，特别是涉及一种目标检测模型的训练方法、装置、计算机设备和存储介质。
技术介绍
目标检测是计算机视觉领域的图像处理技术，目标检测可以从图像中定位出目标。在目标检测任务中，通常会对目标检测出多个预测框，在进行目标检测时，对于输出的多个预测框，可以采用非极大值抑制(NonMaximumSuppression，NMS)技术进行后处理，去除多余的预测框之后得到各个目标对应的最终检测结果。专利技术人发现，传统的目标检测算法主要是根据各个预测框与标注框之间的差异来进行网络训练的，没有将上述的后处理过程加入到训练过程中，导致在检测目标较为拥挤的图像时，采用NMS算法对输出的多个预测框进行后处理得到的检测结果存在漏掉了正确的预测框、保留了错误的预测框的问题，检测效果不太理想。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够在图像中目标较为拥挤的场景下提升检测效果的目标检测模型的训练方法、装置、计算机设备和存储介质。一种目标检测模型的训练方法，所述方法包括：获取样本图像及所述样本图像中多个目标对应的标注框；通过目标检测模型对所述样本图像进行目标检测，获得所述样本图像中多个目标对应的预测框，各所述目标对应的预测框的数量为至少一个；根据所述目标所对应的预测框与标注框之间的差异确定第一损失；根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失，所述第二损失用于增大所述目标检

【技术保护点】
1.一种目标检测模型的训练方法，所述方法包括：/n获取样本图像及所述样本图像中多个目标对应的标注框；/n通过目标检测模型对所述样本图像进行目标检测，获得所述样本图像中多个目标对应的预测框，所述目标对应的预测框的数量为至少一个；/n根据所述目标所对应的预测框与标注框之间的差异确定第一损失；/n根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失，所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度；/n根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失，所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度；/n根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后，返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练，直至获得训练好的目标检测模型。/n

【技术特征摘要】
1.一种目标检测模型的训练方法，所述方法包括：
获取样本图像及所述样本图像中多个目标对应的标注框；
通过目标检测模型对所述样本图像进行目标检测，获得所述样本图像中多个目标对应的预测框，所述目标对应的预测框的数量为至少一个；
根据所述目标所对应的预测框与标注框之间的差异确定第一损失；
根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失，所述第二损失用于增大所述目标检测模型输出的相同目标所对应的预测框之间的重叠程度；
根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失，所述第三损失用于减小所述目标检测模型输出的不同目标所对应的预测框之间的重叠程度；
根据所述第一损失、所述第二损失及所述第三损失调整所述目标检测模型的模型参数后，返回所述获取样本图像及所述样本图像中多个目标对应的标注框的步骤继续训练，直至获得训练好的目标检测模型。

2.根据权利要求1所述的方法，其特征在于，所述通过目标检测模型对所述样本图像进行目标检测，获得所述样本图像中多个目标对应的预测框，包括：
将所述样本图像输入至目标检测模型；
通过所述目标检测模型中的特征提取网络，对所述样本图像进行特征提取，获得所述样本图像对应的图像特征；
通过所述目标检测模型中的分类回归层，根据所述图像特征获得所述样本图像中多个目标对应的预测框。

3.根据权利要求1所述的方法，其特征在于，所述根据所述目标所对应的预测框与标注框之间的差异确定第一损失，包括：
获取所述目标对应的各个预测框的预测坐标信息；
获取所述目标对应的标注框的真实坐标信息；
根据所述预测坐标信息与相应真实坐标信息之间的差异确定第一损失。

4.根据权利要求1所述的方法，其特征在于，所述根据所述样本图像中相同目标所对应的预测框之间的重叠程度确定第二损失，包括：
按照所对应的目标将预测框划分，得到每个目标对应的预测框集合；
迭代执行将当前目标对应的预测框集合中置信度最大的预测框作为当前目标对应的匹配预测框，将所述当前目标对应的预测框集合中的其他预测框依次作为当前处理框，根据所述当前处理框与所述匹配预测框之间的第一重叠程度计算所述当前处理框与所述匹配预测框之间的拉近损失之后，从所述预测框集合中剔除所述匹配预测框的步骤，直至所述当前目标对应的预测框集合为空；
融合各所述当前处理框与匹配预测框之间的拉近损失，得到用于增大所述当前目标所对应的预测框之间的重叠程度的第二损失。

5.根据权利要求4所述的方法，其特征在于，所述当前处理框与所述匹配预测框之间的拉近损失与所述第一重叠程度成反相关，且与所述当前处理框对应的置信度成正相关。

6.根据权利要求4所述的方法，其特征在于，所述当前处理框与所述匹配预测框之间的拉近损失通过以下公式确定：
Loss_pull(b，bmax)＝-ln(1-N+IoU(b，bmax))*s；
其中，bmax表示当前目标对应的匹配预测框，b表示所述当前处理框，IoU(b，bmax)表示所述当前处理框b与所述匹配预测框bmax之间的第一重叠程度，N表示用于进行非极大值抑制处理的预设阈值，s表示所述当前处理框b的置信度，ln表示指数函数，Loss_pull(b，bmax)表示所述当前处理框b与所述匹配预测框bmax之间的拉近损失。

7.根据权利要求1所述的方法，其特征在于，所述根据所述样本图像中不同目标所对应的预测框之间的重叠程度确定第三损失，包括：
根据所述目标对应的预测框，获得全量预测框集合；
迭代执行将所述全量预测框集合中置信度最大的预测框，作为当前处理框；遍历所述全量预测框集合中与所述当前处理框之间的第二重叠程度大于预设阈值的预测框；当遍历的预测框与所述当前处理框对应不同目标时，则根据所述当前处理框与所述遍历的预测框之间的第二重叠程度计算所述当前处理框与所述遍历的...

【专利技术属性】
技术研发人员：罗泽坤，王亚彪，李剑，王昌安，彭瑾龙，汪铖杰，李季檩，方正，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人