一种基于角度锚框的目标定位方法、系统及存储介质技术方案

技术编号:37768413 阅读:17 留言:0更新日期:2023-06-06 13:30
本发明专利技术公开了一种基于角度锚框的目标定位方法、系统及存储介质,所述方法包括:构建基于Yolov5的角度定位网络模型;输出不同尺寸的特征图;引入角度锚框机制,修改基于Yolov5的所述角度定位网络模型的输出形式;将待测图像输入所述基于Yolov5的所述角度定位网络模型,利用基于Yolov5的所述角度定位网络模型的特征图检测目标,输出每个目标的预测数据。本发明专利技术利用yolov5在目标检测上高精度和高执行效率的特点,通过修改yolov5网络模型输出格式。通过在Yolov5算法的基础上引入角度锚框机制,并对应的修改其损失函数,以解决角度周期性和类正方形问题,可以加速角度学习收敛,提高目标检测的效率。标检测的效率。标检测的效率。

【技术实现步骤摘要】
一种基于角度锚框的目标定位方法、系统及存储介质


[0001]本申请涉及机器视觉
,具体而言,涉及一种基于角度锚框的目标定位方法、系统及存储介质。

技术介绍

[0002]基于深度学习的目标检测方法被大量使用在工业制造领域,深度学习可以利用大数据自动学习特征从而具有良好的鲁棒性,如Yolo系列算法、Fast RCNN系列算法、SSD系列算法等可以很好的应用在物体的缺陷检测上。这些算法可以直接预测出物体的位置、类型以及置信度信息,其中位置是指正矩形包围盒,也就是中心位置(x,y)以及盒的宽高(w,h)。上面这些算法预测物体的包围盒具有出色的表现。
[0003]然而工业制造领域很多场景需要检测物体的角度,也就是需要定位物体,即需要预测物体的位置(x、y)、宽高(w,h)和角度(θ)。目前大多数算法都是预测物体的正矩形包围盒,如上面提到的序列算法。也有基于旋转目标检测的深度学习算法,这些算法被用于密集性物体检测(如卫星遥感图像检测)。相对于基于正矩形框的检测算法,基于旋转矩形框检测算法具有更为准确的iou计算方式,因此精度上往往更好。然而,这些旋转目标检测方法对于角度的编码普遍是0~180
°
,也就是只需要将包围目标的最小外接矩形框检测出来即可,无需关心角度的正负(

180
°
~180
°
)。这和它们的应用场景是相关的,因为,如像遥感图像物体检测,只需要提高密集性目标的检测精度即可,而基于0~180
°
的框完全可以满足需要
[0004]所以,在现有深度学习算法上改进一种能预测出目标角度的定位方法非常必要。

技术实现思路

[0005]本申请的目的在于提供一种基于角度锚框的目标定位方法、系统及存储介质,通过在Yolov5算法的基础上引入角度锚框机制,并对应的修改其损失函数,以解决角度周期性和类正方形问题,可以提供目标检测的效率。
[0006]本申请提供了一种基于角度锚框的目标定位方法,包括以下步骤:
[0007]构建基于Yolov5的角度定位网络模型;通过所述基于Yolov5的角度定位网络模型输出不同尺寸的特征图;不同尺寸的特征图分别检测大小不同的目标以提高检测精度;
[0008]引入角度锚框机制,修改基于Yolov5的所述角度定位网络模型的输出形式,将所述基于Yolov5的角度定位网络模型的输出选项修改为:目标位置、旋转矩形框的尺寸、目标置信度、目标类别概率、预测角度以及预测角度概率;
[0009]将待测图像输入所述基于Yolov5的所述角度定位网络模型,利用基于Yolov5的所述角度定位网络模型的特征图检测目标,输出每个目标的预测数据。
[0010]可选地,所述角度锚框机制具体为:
[0011]将整个预测范围分为N段,其中N为正整数;每段预测一个预测角度,同时预测该段中预测角度概率;
[0012]然后将预测角度概率最大的预测角度作均方差回归处理,输出预测角度和预测角度概率。
[0013]可选地,所述N取值为:N=4。
[0014]可选地,所述预测角度编码采用原始角度。
[0015]可选地,所述预测角度编码方式如下:
[0016][0017]σ为sigmoid函数,t
θ
为预测值,θ
k
为预测角度。
[0018]可选地,所述基于Yolov5的角度定位网络模型的损失函数为:
[0019][0020]其中,x为真实目标在直角坐标中的横坐标位置,y为真实目标在直角坐标中的纵轴坐标位置,w为真实目标的高度,h为真实目标的宽度,θ为真实目标的角度,x

为预测目标在直角坐标中的横坐标位置,y

为预测目标在直角坐标中的纵轴坐标位置,w

为预测目标的高度,h

为预测目标的宽度,为预测目标的角度,∑((x

x

)2+(y

y

)2)为位置损失,∑((w

w

)2+(h

h

)2)为尺寸损失,为角度损失,∑cls
θ
为角度类别损失,∑cls
obj
为目标类别损失,∑obj为目标置信度损失。
[0021]第二方面,本申请还提供一种基于角度锚框的目标定位系统,该系统包括:存储器及处理器,所述存储器中包括基于角度锚框的目标定位方法的程序,所述基于角度锚框的目标定位方法的程序被所述处理器执行时实现以下步骤:
[0022]构建基于Yolov5的角度定位网络模型;通过所述基于Yolov5的角度定位网络模型输出不同尺寸的特征图;不同尺寸的特征图分别检测大小不同的目标以提高检测精度;
[0023]引入角度锚框机制,修改基于Yolov5的所述角度定位网络模型的输出形式,将所述基于Yolov5的角度定位网络模型的输出选项修改为:目标位置、旋转矩形框的尺寸、目标置信度、目标类别概率、预测角度以及预测角度概率;
[0024]将待测图像输入所述基于Yolov5的所述角度定位网络模型,利用基于Yolov5的所述角度定位网络模型的特征图检测目标,输出每个目标的预测数据。
[0025]可选地,所述角度锚框机制具体为:
[0026]将整个预测范围分为N段,其中N为正整数;每段预测一个预测角度,同时预测该段中预测角度概率;
[0027]然后将预测角度概率最大的预测角度作均方差回归处理,输出预测角度和预测角度概率;
[0028]所述预测角度编码采用原始角度;
[0029]所述预测角度编码方式如下:
[0030][0031]σ为sigmoid函数,t
θ
为预测值,θ
k
为预测角度。
[0032]可选地,所述基于Yolov5的角度定位网络模型的损失函数为:
[0033][0034]其中,x为真实目标在直角坐标中的横坐标位置,y为真实目标在直角坐标中的纵轴坐标位置,w为真实目标的高度,h为真实目标的宽度,θ为真实目标的角度,x

为预测目标在直角坐标中的横坐标位置,y

为预测目标在直角坐标中的纵轴坐标位置,w

为预测目标的高度,h

为预测目标的宽度,为预测目标的角度,∑((x

x

)2+(y

y

)2)为位置损失,∑((w

w

)2+(h

h

)2)为尺寸损失,为角度损失,∑cls
θ
为角度类别损失,∑cls
obj
为目标类别损失,∑obj为目标置信度损失。
[0035]第三方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于角度锚框的目标定位方法,其特征在于,所述方法包括以下步骤:构建基于Yolov5的角度定位网络模型;通过所述基于Yolov5的角度定位网络模型输出不同尺寸的特征图;不同尺寸的特征图分别检测大小不同的目标以提高检测精度;引入角度锚框机制,修改基于Yolov5的所述角度定位网络模型的输出形式,将所述基于Yolov5的角度定位网络模型的输出选项修改为:目标位置、旋转矩形框的尺寸、目标置信度、目标类别概率、预测角度以及预测角度概率;将待测图像输入所述基于Yolov5的所述角度定位网络模型,利用基于Yolov5的所述角度定位网络模型的特征图检测目标,输出每个目标的预测数据。2.根据权利要求1所述的一种基于角度锚框的目标定位方法,其特征在于,所述角度锚框机制具体为:将整个预测范围分为N段,其中N为正整数;每段预测一个预测角度,同时预测该段中预测角度概率;然后将预测角度概率最大的预测角度作均方差回归处理,输出预测角度和预测角度概率。3.根据权利要求2所述的一种基于角度锚框的目标定位方法,其特征在于,所述N取值为:N=4。4.根据权利要求3所述的一种基于角度锚框的目标定位方法,其特征在于,所述预测角度编码采用原始角度。5.根据权利要求4所述的一种基于角度锚框的目标定位方法,其特征在于,所述预测角度编码方式如下:σ为sigmoid函数,t
θ
为预测值,θ
k
为预测角度。6.根据权利要求1

5任一项所述的一种基于角度锚框的目标定位方法,其特征在于,所述基于Yolov5的角度定位网络模型的损失函数为:其中,x为真实目标在直角坐标中的横坐标位置,y为真实目标在直角坐标中的纵轴坐标位置,w为真实目标的高度,h为真实目标的宽度,θ为真实目标的角度,x

为预测目标在直角坐标中的横坐标位置,y

为预测目标在直角坐标中的纵轴坐标位置,w

为预测目标的高度,h

为预测目标的宽度,为预测目标的角度,Σ((x

x

)2+(y

y

)2)为位置损失,Σ((w

w

)2+(h

h

)2)为尺寸损失,为角度损失,Σcls
θ
为角度类别损失,Σ
cls
obj
为目标类别损失,∑obj为目标置信度损失。7.一种基于角度锚框的目标定位系统,其特征在于,该系统包括...

【专利技术属性】
技术研发人员:曹建伐陈安周才健周柔刚许允迪肖廷哲
申请(专利权)人:温州汇萃智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1