当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于锚框的目标检测算法中先验框设计方法技术

技术编号:28146107 阅读:22 留言:0更新日期:2021-04-21 19:30
本发明专利技术公开了一种基于锚框的目标检测算法中先验框设计方法,所述方法是一种基于训练集样本目标标记框面积聚类算法的先验框设计方法,整体上进行两轮聚类算法计算,第一轮聚类计算得到先验框的面积超参数,并以此结果进行第二轮聚类确定先验框的长宽比超参数,进而完成先验框部署。本发明专利技术充分考虑目标检测算法在实际应用场景中会遇到的特定数据不平衡问题,即数据集中小目标样本数比大目标样本数多一个数量级或以上,创新性地使用基于标记框面积的聚类算法,用大目标面积数值大的特点平衡其样本数量偏少的缺陷,进而得到更适合存在大小目标场景下的先验框超参数,并且能够降低神经网络模型的训练难度,加快训练流程,得到效果更好的目标检测模型。果更好的目标检测模型。果更好的目标检测模型。

【技术实现步骤摘要】
一种基于锚框的目标检测算法中先验框设计方法


[0001]本专利技术属于基于锚框的神经网络目标检测技术,具体是基于锚框的目标检测算法中先验框设计方法。

技术介绍

[0002]目前在目标检测算法的实际落地中,基于锚框的目标检测算法由于其单阶段的范式使其具有耗时低的优点,能满足项目对实时性的要求,故该类算法在实际落地中应用广泛。
[0003]该类基于锚框的目标检测算法在实际应用中,需要先根据实际应用场景或者训练集设置网络先验框超参数,网络输入为待检测的场景图片,网络输出预测框与先验框的偏移量,然后经过解码得到目标的位置以完成目标检测任务。而训练最终得到的模型效果很大程度上取决于先验框超参数的设定,且更优的先验框参数能够加速神经网络的训练。
[0004]在目前大部分目标检测算法学术论文中,均默认训练数据集中的各类样本数量差别不大,即不存在训练样本不均衡的问题。在此基础上,使用的基于锚框的目标检测算法都配套使用由基于交并比的k

means聚类算法得到的先验框超参数,并能够得到较好的训练结果。而目标检测算法在实际落地时,数据集采集很难保证样本均衡,或多或少会存在样本不均衡现象。在此情况下,仍然沿用基于交并比的k

means聚类算法得到的超参数并不是最佳参数,或者说有办法得到更优的超参数。

技术实现思路

[0005]针对以上技术问题,为了得到更优的先验框超参数,以降低神经网络的训练难度,进而得到更高准确率的目标检测模型,本专利技术提供了一种训练集样本中小目标样本数远远多于大目标样本数情况下先验框超参数(先验框面积和先验框的长宽比)的设计方法。
[0006]本专利技术提供的技术方案如下:
[0007]本专利技术的目的之一在于提供一种基于锚框的目标检测算法中先验框设计方法,该方法基于训练集目标框标记数据,其应用条件是训练集中小目标样本数比大目标样本数多一个数量级或以上,先后进行两轮聚类算法计算,第一轮聚类计算得到先验框的面积超参数,并以此结果进行第二轮聚类确定先验框的长宽比超参数,进而完成先验框部署。
[0008]进一步,所述训练集目标框标记数据为坐标数据。
[0009]进一步,所述第一轮聚类基于标记框面积数据,且聚类类别数是目标检测网络结构的输出层级数的整数倍,每个层级特征图上部署相同数量的先验框,计算得到所有先验框的面积超参数。
[0010]进一步,所述第二轮聚类算法计算基于第一轮聚类结果——每个分类簇内的数据,利用每个分类簇内的标记框长宽比数据进行第二轮聚类计算,得到每个先验框面积对应的长宽比超参数。
[0011]进一步,对于不同分类簇内的标记框数据,第二轮聚类类别数相同,每个面积的标
记框质心对应相同数量的不同长宽比的先验框。
[0012]进一步,在得到先验框的所有超参数——面积和长宽比后,按照面积数值大小顺序分配至每个输出层级的特征图,大/小的特征图上部署面积大/小的先验框。
[0013]本方法包括以下步骤:
[0014]步骤1:目标框标记数据处理;
[0015]将训练数据集目标框标记数据的位置框标记信息转化为每个标记框的面积和长宽比数据;
[0016]步骤2:确定标记框面积聚类的类别数;
[0017]第一轮聚类的类别数由网络结构和计算量约束共同决定,类别数为目标检测网络结构输出层级数的整数倍,每个层级特征图上部署相同数量的先验框;
[0018]步骤3:进行第一轮聚类计算;
[0019]以前述步骤准备好的标记框面积数据为输入,进行基于面积的聚类算法计算,聚类类别数由步骤2确定,得到所有先验框的面积超参数及标记框分类簇;
[0020]步骤4:确定每个面积分类簇对应的长宽比聚类的类别数;
[0021]将步骤3中得到的对所有标记框面积聚类的分类结果,根据实际任务需求,确定每个面积分类簇对应的长宽比聚类的类别数;
[0022]步骤5:进行第二轮聚类计算;
[0023]对第一轮聚类算法计算得到的每一分类簇的标记框数据进行第二轮聚类计算,得到每个面积质心对应的先验框长宽比超参数;
[0024]步骤6:先验框部署;
[0025]将所有先验框按照面积数值大小顺序分配至每个输出层级的特征图,每层输出层部署相同数量的先验框,且大/小的特征图上部署面积大/小的先验框。
[0026]进一步,所述步骤2中每个层级特征图上部署先验框的数量越大,网络精度越高,计算量越大。
[0027]进一步,所述步骤4中相同面积先验框对应不同长宽比先验框的数目,该数目越大,网络精度会越高,计算量越大。
[0028]本专利技术的有益效果如下:
[0029]本专利技术提供的技术方案能够较好的缓解训练集中出现的特定数据不平衡问题带来的影响,该数据不平衡问题表现为数据集中小目标样本数比大目标样本数多一个数量级或以上。由本技术方案得到基于锚框的目标检测算法的先验框超参数能够使网络模型更快的训练收敛,且能够得到更高的准确率。
附图说明
[0030]图1本专利技术实施例的先验框部署示意图;
[0031]图2专利技术实施例的两轮聚类算法示意图。
具体实施方式
[0032]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不
用于限定本专利技术。
[0033]实施例
[0034]本专利技术提供的一种基于训练集样本目标标记框面积的聚类算法(常用k

means聚类)的先验框设计方法,就是要确定先验框的超参数,包括先验框的面积和长宽比。参见图1,在神经网络的一个输出层级,该输出层级的特征图高为H,宽为W,在H*W个网格上的每个小格上设置若干个不同面积和长宽比的先验框,实施例中每个小格设置了2个先验框,面积一大一小,长宽比均设置为1,图1中只绘制出了中间小格的先验框,其他小格的先验框省略,小格中心黑点为先验框中心坐标。
[0035]参见图2,本专利技术利用原始目标框标记数据,先后进行两轮聚类算法计算得到先验框的面积超参数及每个面积对应的不同长宽比的先验框。第一轮,基于训练集所有训练数据的标记框面积数据,进行聚类类别数为k1的聚类计算,得到先验框的面积超参数;第二轮,在第一轮聚类结果基础上,基于k1个类别中的每个分类簇内的标记框长宽比数据,进行聚类类别数为k2的聚类,得到所有先验框的长宽比超参数。
[0036]本专利技术提供的一种基于训练集样本目标标记框面积的聚类算法的先验框设计方法包括以下步骤:
[0037]步骤1:处理训练集数据以能够使用聚类算法。对于目标检测任务,训练数据集会在图像上标记需要检测出的目标的位置框和类别标签,具体的位置会以目标在图片中的像素索引值范围表示:(xmin,xmax,ymin,ymax),其中xmin、xmax、ymin、ymax分别表示目标在图片中位置的左上角横坐标像素索引值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于锚框的目标检测算法中先验框设计方法,其特征在于:该方法基于训练集目标框标记数据,先后进行两轮聚类算法计算,第一轮聚类计算得到先验框的面积超参数,并以此结果进行第二轮聚类确定先验框的长宽比超参数,进而完成先验框部署。2.根据权利要求1所述的方法,其特征在于:所述训练集目标框标记数据为坐标数据。3.根据权利要求1所述的方法,其特征在于:所述第一轮聚类基于标记框面积数据,且聚类类别数是目标检测网络结构的输出层级数的整数倍,每个层级特征图上部署相同数量的先验框,计算得到所有先验框的面积超参数。4.根据权利要求1所述的方法,其特征在于:所述第二轮聚类算法计算基于第一轮聚类结果——每个分类簇内的数据,利用每个分类簇内的标记框长宽比数据进行第二轮聚类计算,得到每个先验框面积对应的长宽比超参数。5.根据权利要求1所述的方法,其特征在于:对于不同分类簇内的标记框数据,第二轮聚类类别数相同,每个面积的标记框质心对应相同数量的不同长宽比的先验框。6.根据权利要求1所述的方法,其特征在于:在得到先验框的所有超参数——面积和长宽比后,按照面积数值大小顺序分配至每个输出层级的特征图,大/小的特征图上部署面积大/小的先验框。7.根据权利要求1

6任一项所述的方法,其特征在于,包括以下步骤:步骤1:目标框标记数据...

【专利技术属性】
技术研发人员:常胜田野吴李煜王子枫
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1