一种基于角点的多尺度目标检测方法技术

技术编号：40964407 阅读：3 留言：0更新日期：2024-04-18 20:44

本发明专利技术公开了一种基于角点的多尺度目标检测方法，具体涉及目标检测技术领域，包括：在网络主体结构中，输入分辨率为3×512×512的RGB图像，利用7×7stride＝2的卷积层对RGB图像进行分辨率处理，使得RGB图像的分辨率降低为原来的一半，以获得128×256×256的第一特征图；基于第一特征图使用残差单元(stride＝1)对特征图进行处理，并使用MaxPooling层对特征图进行上采样，使得分辨率再次减半，最终得到的第二特征图分辨率为256×128×128；本发明专利技术使用maxpooling代替stride＝2的卷积层，能够增加感受野，同时减少了卷积层的步距，更利于特征信息提取。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及目标检测，更具体地说，本专利技术涉及一种基于角点的多尺度目标检测方法。

技术介绍

1、目标检测一直以来都是计算机视觉领域的研究热点之一，其任务是返回给定图像中的单个或多个特定目标的类别与矩形包围框坐标。随着神经网络研究的飞速进展，r-cnn检测器的诞生标志着目标检测正式进入深度学习时代，速度和精度相较于传统算法均有了极大的提升。

2、但是，目标检测的尺度问题对于深度学习算法而言也始终是一个难题，即检测器对于尺度极大或极小目标的检测精度会显著下降，因此，近年来有不少学者在研究如何才能更好地实现多尺度目标检测，已有一系列的综述文章从算法流程、网络主体结构、训练方式和数据集等方面对基于深度学习的目标检测算法进行了总结与分析。对基于深度学习的目标检测的两个主要算法流派，包括以r-cnn系列为代表的两阶段算法和以yolo、ssd为代表的一阶段算法；多尺度目标检测的实现主要包括，图像金字塔、构建网络内的特征金字塔等典型策略。上述两种目标检测方法都是基于事先确定好的锚点框，再进行目标边界框的回归。law等人提出的cornernet，舍弃了锚点框，改用预测边界框的角点，省却了很多计算量。

3、在现有技术中，cornernet中使用stride＝2的卷积层代替maxpooling层，但是降低了特征图的感受，导致网络特征提取的能力减弱；在采样过程中只使用了最近邻插值上采样方法，一定程度上增加了特征图填充的随机性，增大了与实际情况的差距。

4、为此，本专利技术提供了一种基于角点的多尺度目标检测方法。</p>

技术实现思路

1、为了克服现有技术的上述缺陷，本专利技术的实施例提供一种基于角点的多尺度目标检测方法，以解决上述
技术介绍
中提出的问题。

2、为实现上述目的，本专利技术提供如下技术方案：一种基于角点的多尺度目标检测方法，包括：

3、在网络主体结构中，输入分辨率为3×512×512的rgb图像，利用7×7stride＝2的卷积层对rgb图像进行分辨率处理，使得rgb图像的分辨率降低为原来的一半，以获得128×256×256的第一特征图；

4、基于第一特征图使用残差单元(stride＝1)对特征图进行处理，并使用maxpooling层对特征图进行上采样，使得分辨率再次减半，最终得到的第二特征图分辨率为256×128×128；

5、通过损失函数对网络主体结构进行损失分析，所述损失函数包括第一损失函数、第二损失函数和第三损失函数。

6、进一步地，在网络主体结构中，使用两个改进的hourglass module，并且中间使用单个卷积层和残差分支连接，经过网络主体结构输出的特征图分辨率为256×128×128。

7、进一步地，第一个改进的hourglass module的内容如下：

8、在进行上采样的过程中，对底层特征图使用最近邻插值法，得到与其上一级的特征图相同尺寸的特征图，将上采样得到的特征图使用两个残差结构再次卷积；同时，在一条并行支路上，使用反卷积对底层特征进行上采样，最后将两条支路上的特征图，进行按元素相加，最终使用5次上采样，得到最终hourglass modules的输出。

9、进一步地，第一个改进的hourglass module的内容还包括：

10、将hourglass module的输出，采用并行支路进行处理，所述并行支路包括第一支路、第二支路和第三支路，第一支路和第二支路均使用3x3的卷积层得到特征图，第一支路使用从右向左的最大池化求得每个像素位置上，在当前行且其一边所有像素的最大值，作为该位置的像素值，第二支路使用从下往上的最大池化求得每个像素位置上，在当前列且其下边所有像素的最大值，作为该位置的像素值，第三支路使用1x1的卷积对特征信息进行融合，当并行支路提取完特征后，采用元素相加法，得到一个特征图，并通过并行支路得到三个不同维度的特征图。

11、进一步地，第二个改进的hourglass module的内容如下：

12、针对边界框右下角的角点，经过hourglass module后，通过第一分支预测右下角角点的网络主体结构，结构与左上角池化结构一致，不同的是，在角点池化结构中，右下角角点池化是其中一个使用从左向右的最大池化求得每个像素位置上，在当前行且其左边所有像素的最大值，作为当前位置的像素值，另一个使用从下往上的最大池化求得每个像素位置上，在当前列且其上边所有像素的最大值，作为当前位置的像素值。

13、进一步地，第一损失函数的损失量的计算方法如下：

14、在训练样本中，将边界框的左上角的坐标或右下角的坐标对应的类别概率设为1，

15、同时在角点周围使用高斯函数设置角点周围的值，r是指与标注框的iou为0.7的边界框，它的角点与标注框的角点的距离；

16、通过如下公式计算类别预测损失，pcij为当前类别下角点对应的概率，ycij为当前类别下角点对应的样本概率，α＝2,β＝4；

17、

18、进一步地，第二损失函数的损失量的计算方法如下：

19、第二损失函数用来聚集同一个标注框的角点，和区别不同标注框角点的损失函数，etk为标注框左上角点对应的标识值，ebk为标注框右下角点对应的标识值，ek两者的平均值，ej为与k不同的框的角点标识值的平均值，使用lpull将同一个标注框的角点距离拉近，使用lpush将不同标注框的角点距离拉远；

20、

21、

22、进一步地，第三损失函数的损失量的计算方法如下：

23、第三损失函数为是偏移损失，ok为偏移量的标注，利用标注框的角点坐标映射到特征图上的浮点型值，将浮点型值进行整型化，利用两种类型的差值作为标注，为预测的偏移量，使用soothl1loss计算两者之间的损失量，计算公式如下：

24、

25、进一步地，网络主体结构的总损失量为：l＝ldet+lpull+lpush+loff。

26、第二方面，本专利技术提供一种电子设备，包括：处理器和存储器，其中，所述存储器中存储有可供处理器调用的计算机程序；

27、所述处理器通过调用所述存储器中存储的计算机程序，执行上述的一种基于角点的多尺度目标检测方法。

28、本专利技术的技术效果和优点：

29、本专利技术使用maxpooling代替stride＝2的卷积层，能够增加感受，同时减少了卷积层的步距，更利于特征信息提取；

30、本专利技术使用反卷积和最近邻插值进行上采样，可以降低最近邻插值的随机性，同时利用反卷积的有点，让特征图更贴近真实情况，还可以降低maxpooling层对特征信息的折损；

31、本专利技术使用stride＝1的残差单元与maxpooling代替原来的stride＝2的残差单元，增加特征抽象能力。

本文档来自技高网...

【技术保护点】

1.一种基于角点的多尺度目标检测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于角点的多尺度目标检测方法，其特征在于，在网络主体结构中，使用两个改进的hourglass module，并且使用单个卷积层和残差分支连接，经过网络主体结构输出的特征图分辨率为256×128×128。

3.根据权利要求2所述的一种基于角点的多尺度目标检测方法，其特征在于，第一个改进的hourglass module的内容如下：

4.根据权利要求3所述的一种基于角点的多尺度目标检测方法，其特征在于，第一个改进的hourglass module的内容还包括：

5.根据权利要求4所述的一种基于角点的多尺度目标检测方法，其特征在于，第二个改进的hourglass module的内容如下：

6.根据权利要求5所述的一种基于角点的多尺度目标检测方法，其特征在于，第一损失函数的损失量的计算方法如下：

7.根据权利要求6所述的一种基于角点的多尺度目标检测方法，其特征在于，第二损失函数的损失量的计算方法如下：

8.根据权利要求7

9.根据权利要求8所述的一种基于角点的多尺度目标检测方法，其特征在于，网络主体结构的总损失量为：L＝Ldet+Lpull+Lpush+Loff。

10.一种电子设备，其特征在于，包括：处理器和存储器，其中，所述存储器中存储有可供处理器调用的计算机程序；

...

【技术特征摘要】

1.一种基于角点的多尺度目标检测方法，其特征在于，包括：

3.根据权利要求2所述的一种基于角点的多尺度目标检测方法，其特征在于，第一个改进的hourglass module的内容如下：

4.根据权利要求3所述的一种基于角点的多尺度目标检测方法，其特征在于，第一个改进的hourglass module的内容还包括：

5.根据权利要求4所述的一种基于角点的多尺度目标检测方法，其特征在于，第二个改进的h...

【专利技术属性】
技术研发人员：张渊佳，王卫锋，陈硕，孟祥松，李响，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人