当前位置: 首页 > 专利查询>山东省人工智能研究院专利>正文

一种基于改进YOLOv5的高分辨率目标检测方法技术

技术编号：38091649 阅读：11 留言：0更新日期：2023-07-06 09:03

一种基于改进YOLOv5的高分辨率目标检测方法，通过HTBlock替代原来骨干网络(backbone)中的C3模块，利用特征映射中的冗余性，对特征图通道的头部和尾部进行卷积，中间通道保持不变，这样可以减少冗余计算，更有效的提取空间特征。通过新的特征融合模块，底层特征经过自注意力机制，更加注重特征图的重要部分，而高层特征通过反向注意力会注重以往忽略的部分，往往这个部分会包含丰富的细节特征。之后二者进行融合，得到的特征图既有高级语义信息又包含细节信息，这可以大大提升高分辨率目标检测的性能。辨率目标检测的性能。辨率目标检测的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进YOLOv5的高分辨率目标检测方法

[0001]本专利技术涉及目标检测
，具体涉及一种基于改进YOLOv5的高分辨率目标检测方法。

技术介绍

[0002]目前，以深度学习为代表的人工智能算法凭借超大规模数据集以及强大的计算资源，在图像分类、目标检测等领域取得了出色的成果。在目标检测领域，许多学者提出了大量优秀的检测算法，这些算法低分辨率数据集能达到精度较高、速度较快的检测结果，并且逐步实现了实时性的检测。但是也存在一些问题，一方面，由于经过普通卷积得到的特征图存在大量的冗余，不可避免地会增加一些计算，降低模型运算效率；另一方面，随着各种成像设备像素的提升，获取高分辨率图片变得更加简单，高分辨率图像中往往包含更多的颜色、空间关系、纹理、边缘等细节特征，在目标检测领域中，经过连续的下采样，高分辨率图像中的小目标和细节信息会丢失，针对这一问题，以往的方法使用特征金字塔(FPN)及特征金字塔的变体将含有丰富细节信息但语义信息不足的低级特征和含有足够的语义信息但细节信息丢失的高级特征进行融合，由于语义差距的存在，简单的将低级特征和高级特征结合起来，会将有用的信息淹没在海量的无用信息中，无法得到信息丰富的特征。

技术实现思路

[0003]本专利技术为了克服以上技术的不足，提供了一种提高分辨率目标检测性能的方法。本专利技术克服其技术问题所采用的技术方案是：
[0004]一种基于改进YOLOv5的高分辨率目标检测方法，包括如下步骤：
[0005]a)获取n张高分辨率图像，形成原始的高...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的高分辨率目标检测方法，其特征在于，包括如下步骤：a)获取n张高分辨率图像，形成原始的高分辨率图像集合I，I＝{I1,I2,...,I
i
,...,I
n
}，I
i
为第i张高分辨率图像，i∈{1,...,n}；b)将高分辨率图像集合I划分为训练集I
t
和验证集I
v
，，为训练集I
t
中第i张图像，i∈{1,...,m}，m为训练集I
t
中图像的数量，中图像的数量，为验证集I
v
中第i张图像，i∈{1,...,u}，u为验证集I
v
中图像的数量；c)将训练集I
t
中的各个高分辨率图像和验证集I
v
各个高分辨率图像分别进行预处理，得到预处理后的训练集h
t
及预处理后的验证集h
v
，，为预处理后的训练集h
t
中第i张预处理后的图像，中第i张预处理后的图像，为预处理后的验证集h
v
中第i张预处理后的图像；d)将预处理后的训练集h
t
中第i张预处理后的图像输入到第一下采样模块中，得到初始特征图T；e)将初始特征图T输入到改进的YOLOv5的骨干网络中，得到特征F1、特征F2、特征F3、特征F4；f)将特征F4输入到YOLOv5的SPPF模块中，输出得到特征Z4；g)将特征Z4、特征F1、特征F2、特征F3输入到特征融合模块中进行融合，得到融合后的特征P4；h)将特征P4输入到YOLOv5 Neck的FPN模块中，将输出的上采样后特征分别于特征F1、特征F2、特征F3相加，分别得到特征Z1、特征Z2、特征Z3；i)将特征Z1输入到YOLOv5 Neck的PAN模块中，将输出的下采样后特征分别于特征Z2、特征Z3相加，分别得到特征P2、特征P3；j)将特征P2、特征P3、特征P4输入到YOLOv5的Head模块中进行多尺度预测，定位出目标在第i张高分辨率图像中的位置并识别出目标所属的类别。2.根据权利要求1所述的基于改进YOLOv5的高分辨率目标检测方法，其特征在于：步骤b)中按照3:1的比例将高分辨率图像集合I划分为训练集I
t
和验证集I
v
。3.根据权利要求1所述的基于改进YOLOv5的高分辨率目标检测方法，其特征在于，步骤c)包括如下步骤：c
‑
1)使用标注软件Labellmg对训练集I
t
中的各个高分辨率图像和验证集I
v
各个高分辨率图像进行标注，标注信息包括目标的大小、位置、类别；c
‑
2)将训练集I
t
中的各个高分辨率图像分辨率和验证集I
v
各个高分辨率图像分辨率均统一缩放到640
×
640；c
‑
3)将缩放后的训练集I
t
中的各个高分辨率图像和验证集I
v
各个高分辨率图像依次进行随机剪裁、随机翻转操作进行数据增强操作，得到预处理后的训练集h
t
及预处理后的验
证集h
v
。4.根据权利要求1所述的基于改进YOLOv5的高分辨率目标检测方法，其特征在于：步骤d)中第一下采样模块依次由卷积层、正则化层、SiLU激活函数层构成，第一下采样模块的卷积层的卷积核大小为6
×
6、步长为2、填充为2。5.根据权利要求1所述的基于改进YOLOv5的高分辨率目标检测方法，其特征在于，步骤e)包括如下步骤：e
‑
1)改进的YOLOv5的骨干网络由第一分支、第二分支、第三分支、第四分支构成；e
‑
2)改进的YOLOv5的骨干网络的第一分支由下采样模块、HTBlock模块构成，第一分支的下采样模块依次由卷积层、正则化层、SiLU激活函数层构成，第一分支的HTBlock模块由HTConv单元、逐点卷积单元构成，HTConv单元由头部分支、尾部分支、中间分支构成，头部分支依次由卷积层、正则化层、SiLU激活函数层构成，尾部分支依次由卷积层、正则化层、SiLU激活函数层构成，中间分支由恒等映射层构成，逐点卷积单元依次由卷积层、正则化层、SiLU激活函数层构成，将初始特征图T输入到第一分支的下采样模块中，输出得到特征特征的通道数为C，将特征输入到HTBlock模块的HTConv单元的头部分支中，输出得到特征将特征输入到HTBlock模块的HTConv单元的尾部分支中，输出得到特征将特征输入到HTBlock模块的HTConv单元的中间分支中，输出得到特征特征的通道数量为C
H
，C
H
＝C*R
h
，R
h
为头部进行卷积的通道比例，特征的通道数量为C
T
，C
T
＝C*R
t
，R
t
为尾部进行卷积的通道比例，将特征特征特征在通道维度上拼接操作，得到特征将特征输入到HTBlock模块的逐点卷积单元中，输出得到特征将特征与特征相加得到特征F1；e
‑
3)改进的YOLOv5的骨干网络的第二分支由下采样模块、HTBlock模块构成，第二分支的下采样模块依次由卷积层、正则化层、SiLU激活函数层构成，第二分支的HTBlock模块由第一HTConv单元、第一逐点卷积单元、第二HTConv单元、第二逐点卷积单元构成，第一HTConv单元和第二HTConv单元均由头部分支、尾部分支、中间分支构成，头部分支依次由卷积层、正则化层、SiLU激活函数层构成，尾部分支依次由卷积层、正则化层、SiLU激活函数层构成，中间分支由恒等映射层构成，第一逐点卷积单元和第二逐点卷积单元均依次由卷积层、正则化层、SiLU激活函数层构成，将特征F1输入到第二分支的下采样模块中，输出得到特征特征的通道数为2C，将特征输入到HTBlock模块的第一HTConv单元的头部分支中，输出得到特征将特征输入到HTBlock模块的第一HTConv单元的尾部分支中，输出得到特征将特征输入到HTBlock模块的第一HTConv单元的中间分支中，输出得到特征特征的通道数量为C
H
，C
H
＝2C*R
h
，R
h
为头部进行卷积的通
道比例，特征的通道数量为C
T
，C
T
＝2C*R
t
，R
t
为尾部进行卷积的通道比例，将特征特征特征在通道维度上拼接操作，得到特征将特征输入到HTBlock模块的第一逐点卷积单元中，输出得到特征将特征与特征相加得到特征将特征输入到HTBlock模块的第二HTConv单元的头部分支中，输出得到特征将特征输入到HTBlock模块的第二HTConv单元的尾部分支中，输出得到特征将特征输入到HTBlock模块的第二HTConv单元的中间分支中，输出得到特征特征的通道数量为C
H
，C
H
＝2C*R
h
，R
h
为头部进行卷积的通道比例，特征的通道数量为C
T
，C
T
＝2C*R
t
，R
t
为尾部进行卷积的通道比例，将特征特征特征在通道维度上拼接操作，得到特征将特征输入到HTBlock模块的第二逐点卷积单元中，输出得到特征将特征和特征相加得到特征F2；e
‑
4)改进的YOLOv5的骨干网络的第三分支由下采样模块、HTBlock模块构成，第三分支的下采样模块依次由卷积层、正则化层、SiLU激活函数层构成，第三分支的HTBlock模块由第一HTConv单元、第一逐点卷积单元、第二HTConv单元、第二逐点卷积单元、第三HTConv单元、第三逐点卷积单元构成，第一HTConv单元、第二HTConv单元、第三HTConv单元均由头部分支、尾部分支、中间分支构成，头部分支依次由卷积层、正则化层、SiLU激活函数层构成，尾部分支依次由卷积层、正则化层、SiLU激活函数层构成，中间分支由恒等映射层构成，第一逐点卷积单元、第二逐点卷积单元、第三逐点卷积单元均依次由卷积层、正则化层、SiLU激活函数层构成，将特征F2输入到第三分支的下采样模块中，输出得到特征特征的通道数为4C，将特征输入到HTBlock模块的第一HTConv单元的头部分支中，输出得到特征将特征输入到HTBlock模块的第一HTConv单元的尾部分支中，输出得到特征将特征输入到HTBlock模块的第一HTConv单元的中间分支中，输出得到特征特征的通道数量为C
H
，C
H
＝4C*R
h
，R
h
为头部进行卷积的通道比例，特征的通道数量为C
T
，C
T
＝4C*R
t
，R
t
为尾部进行卷积的通道比例，将特征特征特征在通道维度上拼接操作，得到特征将特征输入到HTBlock模块的第一逐点卷积单元中，输出得到特征将特征与特征相加得到特征将特征输入到HTBlock模块的第二HTConv单元的头部分支中，输出得到特征将特征
输入到HTBlock模块的第二HTConv单元的尾部分支中，输出得到特征将特征输入到HTBlock模块的第二HTConv单元的中间分支中，输出得到特征特征的通...

【专利技术属性】
技术研发人员：李金宝，朱亚茹，高天雷，魏诺，徐鹏摇，
申请(专利权)人：山东省人工智能研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

相关技术

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术