模型训练方法、图像处理方法、装置以及可读存储介质制造方法及图纸

技术编号:37639513 阅读:25 留言:0更新日期:2023-05-25 10:06
本申请提供一种模型训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。该图像处理方法包括:获取若干真实标注框,以及获取目标检测头的目标特征图;按照目标检测头的粒度设置目标组锚框,其中,不同粒度的目标检测头对应的锚框组数不同;获取若干真实标注框在目标特征图的投影点位;基于投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框的锚框尺寸;按照真实标注框及其对应的锚框尺寸对待训练模型进行训练。通过上述方式,图像处理装置通过使用聚类算法,在更精细的位置粒度上,对锚框进行聚类,使目标检测的定位准确性得到提升。定位准确性得到提升。定位准确性得到提升。

【技术实现步骤摘要】
模型训练方法、图像处理方法、装置以及可读存储介质


[0001]本申请涉及图像处理
,特别是涉及一种模型训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。

技术介绍

[0002]目标检测(Object Detection,OD)是机器视觉、人工智能等科研领域重要的研究方向,交通、安防、生态环保等各领域都使用OD作为实现业务逻辑的底层支撑。OD的任务是将图像或者视频中的人或者物定位和识别出来,以在此基础上完成跟踪、行为分析、数量统计、报警等功能。当前,OD主要通过深度学习方法作为实现手段。
[0003]图像处理方法通常可按有无锚框分为anchor

based方法和anchor

free方法,前者在特征图上设定先验锚框进行目标定位,后者基于特征图点位直接对目标进行定位。典型的anchor

free方法有YOLOv1,anchor

based方法有YOLOv3、Faster R

CNN等。一般而言,anchor

based方法在定位效果上优于anchor

free方法。
[0004]锚框是一种假设在图片或者特征图上的先验框。定位任务和识别任务在深度学习中分别建模为回归任务和分类任务,先验框的恰当使用被证明有利于提升定位精度和稳定性。Faster R

CNN中为特征图的每个点设定了9个大小、形状不一的锚框,YOLOv3则为不同尺度的检测head分别设定了3组不同形状和尺寸锚框。锚框作为一种先验而存在,可以简单理解为在没有任何数据驱动下,神经网络将输出的目标形状和尺寸,其思想与概率模型中贝叶斯先验一致。先验直接影响建模的准确性,因此锚框通常也不是随机指定的,而是精心设计或者通过统计方法、学习方法得到的。通常使用聚类算法获得锚框,如k

means聚类。
[0005]一般情况下,较大尺寸锚框用适用于检测大目标,小尺寸锚框则适用于检测小目标。不同宽高比的锚框也适合检测与自身相近形状的锚框。为了能适应和覆盖不同尺寸、不同形状的目标,通常给出多种组合,例如Faster R

CNN中对3种尺寸和3种形状的进行组合得出9种锚框,因此特征图的每个点位有9个锚框与之对应。然而,锚框数量也不是越多越好,锚框过多,会导致推理阶段的非极大值抑制过程计算量较大,检测算法耗时过多,并且锚框之间覆盖的目标区间重复度较大,也是一种浪费或引起正负样本不稳定。例如,对17x17特征图,分配9个锚框,则有17x17x9=2601个锚框,将n个GT分配给2601个锚框的产生的耗时将降低训练效率,过多锚框也将导致实时检测难以实现。反之,锚框太少,则会出现覆盖范围过小、定位不准的问题。

技术实现思路

[0006]本申请提供了一种模型训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。
[0007]本申请提供了一种模型训练方法,所述模型训练方法包括:
[0008]获取若干真实标注框,以及获取目标检测头的目标特征图;
[0009]按照所述目标检测头的粒度设置目标组锚框,其中,不同粒度的目标检测头对应
的锚框组数不同;
[0010]获取若干所述真实标注框在所述目标特征图的投影点位;
[0011]基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框的锚框尺寸;
[0012]按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练。
[0013]其中,所述基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框的锚框尺寸,包括:
[0014]以所述投影点位落在当前组锚框对应点位的所有真实标注框进行聚类;
[0015]获取预设数量的聚类中心对应的真实标注框尺寸作为当前组锚框的锚框尺寸。
[0016]其中,粗粒度的目标检测头对应的目标组锚框组数为一组;
[0017]中粒度的目标检测头对应的目标组锚框组数为对应特征图的列数;
[0018]细粒度的目标检测头对应的目标组锚框组数为对应特征图的点位数。
[0019]其中,所述按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练,包括:
[0020]获取所述真实标注框的投影点位关联的训练组锚框;
[0021]获取所述真实标注框与所述训练组锚框中所有锚框的交并比;
[0022]利用所述交并比最大的锚框对所述待训练模型做正样本回归训练;
[0023]利用所述训练组锚框中的其余锚框对所述待训练模型做负样本回归训练。
[0024]其中,所述利用所述交并比最大的锚框对所述待训练模型做正样本回归训练之后,所述模型训练方法还包括:
[0025]利用所述交并比最大的锚框与其对应的真实标注框对所述待训练模型做类别和/或位置的差异训练。
[0026]其中,所述获取所述真实标注框的投影点位关联的训练组锚框之前,所述模型训练方法还包括:
[0027]遍历所述目标检测头的目标特征图上的所有点位,执行:获取每一点位的锚框与所有真实标注框的最大交并比;
[0028]在所述最大交并比小于等于负样本阈值时,不对该点位的锚框训练。
[0029]本申请还提供了另一种模型训练方法,所述模型训练方法包括:
[0030]获取若干真实标注框,以及获取目标检测头的目标特征图;
[0031]获取所述真实标注框在所述目标特征图的投影点位关联的训练组锚框;
[0032]获取所述真实标注框与所述训练组锚框中所有锚框的交并比;
[0033]利用所述交并比最大的锚框对所述待训练模型做正样本回归训练;
[0034]利用所述训练组锚框中的其余锚框对所述待训练模型做负样本回归训练。
[0035]其中,所述获取所述真实标注框在所述目标特征图的投影点位关联的训练组锚框之前,所述模型训练方法还包括:
[0036]按照所述目标检测头的粒度设置目标组锚框,其中,不同粒度的目标检测头对应的锚框组数不同;
[0037]获取若干所述真实标注框在所述目标特征图的投影点位;
[0038]基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框
的锚框尺寸。
[0039]本申请还提供了一种图像处理方法,所述图像处理方法包括:
[0040]获取待处理图像;
[0041]利用预先训练的目标检测模型对所述待处理图像进行目标检测,获取所述待处理图像的目标信息;
[0042]其中,所述目标检测模型通过上述的模型训练方法训练得到。
[0043]本申请还提供了一种图像处理装置,所述图像处理装置包括处理器和存储器,所述存储器中存储有程序数据,所述处理器用于执行所述程序数据以实现如上述的模型训练方法,和/或图像处理方法。
[0044]本申请还提供了一种计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述模型训练方法包括:获取若干真实标注框,以及获取目标检测头的目标特征图;按照所述目标检测头的粒度设置目标组锚框,其中,不同粒度的目标检测头对应的锚框组数不同;获取若干所述真实标注框在所述目标特征图的投影点位;基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框的锚框尺寸;按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练。2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类,获取每组锚框的锚框尺寸,包括:以所述投影点位落在当前组锚框对应点位的所有真实标注框进行聚类;获取预设数量的聚类中心对应的真实标注框尺寸作为当前组锚框的锚框尺寸。3.根据权利要求1所述的模型训练方法,其特征在于,粗粒度的目标检测头对应的目标组锚框组数为一组;中粒度的目标检测头对应的目标组锚框组数为对应特征图的列数;细粒度的目标检测头对应的目标组锚框组数为对应特征图的点位数。4.根据权利要求1所述的模型训练方法,其特征在于,所述按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练,包括:获取所述真实标注框的投影点位关联的训练组锚框;获取所述真实标注框与所述训练组锚框中所有锚框的交并比;利用所述交并比最大的锚框对所述待训练模型做正样本回归训练;利用所述训练组锚框中的其余锚框对所述待训练模型做负样本回归训练。5.根据权利要求4所述的模型训练方法,其特征在于,所述利用所述交并比最大的锚框对所述待训练模型做正样本回归训练之后,所述模型训练方法还包括:利用所述交并比最大的锚框与其对应的真实标注框对所述待训练模型做类别和/或位置的差异训练。6.根据权利要求4所述的模型训练方法,其特征在于,所述获取所述真实标注框的投影点位关联的训练组锚框之前,所述模型...

【专利技术属性】
技术研发人员:王仁根张朋张学涵蔡丹平虞响陈波扬黄鹏殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1