基于改进YOLOv5模型的大分辨率图像目标检测方法及系统技术方案

技术编号：36384090 阅读：24 留言：0更新日期：2023-01-18 09:46

本发明专利技术提供了一种基于改进YOLOv5模型的大分辨率图像目标检测方法及系统，包括如下：获取包含小目标类别的图像数据构建训练集和验证集；获取大分辨率街景图像构建测试集；改进YOLOv5模型，搭建新的检测模型，新模型包括：输入层、骨干网络、BiFPN结构、Head网络；采用Soft

全部详细技术资料下载

【技术实现步骤摘要】
基于改进YOLOv5模型的大分辨率图像目标检测方法及系统

[0001]本专利技术涉及图像目标检测
，具体涉及一种基于改进YOLOv5模型的大分辨率图像目标检测方法及系统。

技术介绍

[0002]目标检测是当前计算机视觉领域的热点研究方向，在传统的图像分类任务中，计算机往往只关注输入的图像中最重要的特征，然后输出图像最可能的类别。而目标检测的任务则是识别出输入图像中计算机感兴趣的所有物体，并输出这些物体的类别以及具体的位置，目标检测任务比分类任务要求更高，也更难达到高精准度。
[0003]现有的目标检测模型分为：One
‑
stage检测模型和Two
‑
stage检测模型。Two
‑
stage检测模型先被提出，该模型先在图像中生成大量的候选区域(region proposal)，再通过卷积神经网络对这些区域进行特征提取，最后识别类别和位置，常用的Two
‑
stage检测模型有R
‑
CNN、SPP
‑
Net、Fast R
‑
CNN、Faster R
‑
CNN等。虽然Two
‑
stage检测模型在检测精度上越来越高，但是检测速度却很难提升，One
‑
stage检测模型的出现很好的解决了这一问题。One
‑
stage检测模型则不需要生成候选区域，该模型直接从输入图像中提取特征，继而预测物体的类别和位置信息，常用的算法有...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5模型的大分辨率图像目标检测方法，其特征在于，包括如下步骤：基于获取到的包括小目标类别的图像数据构建训练集和验证集；基于获取到的大分辨率街景图像构建测试集；改进YOLOv5模型，搭建新的检测模型，新的检测模型包括：输入层、骨干网络、BiFPN结构及Head网络；所述改进YOLOv5模型的具体步骤如下：在所述输入层中加入clip算法和数据增强方法，对输入图像进行预处理；采用改进后的EfficientNet网络作为骨干网络，压缩图像得到深度特征图的同时减少参数计算量；在骨干网络后加入BiFPN结构将各尺度特征进行融合；所述Head网络包含三种检测头，分别包含20*20、40*40、80*80三种尺寸预测层，改进初始锚框；采用Soft
‑
NMS算法替换NMS算法实现极大值抑制，采用CIOU_Loss作为损失函数，采用Momentum
‑
SGD作为优化器，使用MultiStepLR算法动态调整学习率；设置训练参数，利用训练集对新的检测模型进行训练，得到训练后的模型及权重文件，利用验证集和map@0.6指标对训练后的模型进行性能评估；基于训练后的模型对测试集中大分辨率街景图像进行检测，得到包含目标类别和目标位置坐标的检测结果。2.根据权利要求1所述的基于改进YOLOv5模型的大分辨率图像目标检测方法，其特征在于，使用标注工具对所述小目标类别的图像数据进行标注，并根据数据集大小设定划分比例，按照划分比例分为训练集和验证集；所述小目标类别包括汽车、行人及垃圾桶；所述测试集中大分辨率街景图像包括自然环境下的街景图像、含有行人和汽车且分辨率不小于2560像素*1440像素。3.根据权利要求1所述的基于改进YOLOv5模型的大分辨率图像目标检测方法，其特征在于，所述clip算法和数据增强方法，包括以下步骤：设定滑动窗口大小为640*640，设定宽和高阈值为640、640；所述训练集和测试集中图像进入模型前，拦截宽和高大于阈值的图像，使用滑动窗口从图像左上角开始进行区域裁剪，先向右滑动，再向下滑动，每次裁剪的区域和前一次裁剪的区域的重叠度为20％；对裁剪后剩余边缘子图采用letterbox方法填充至640像素*640像素，将裁剪得到的所有图像合并成多通道图像进入模型；对进入模型的图像采用augment
‑
hsv算法，提升图像的亮度和饱和度，采用centercrop算法和random
‑
compose算法，裁剪图像中心区域并合并到随机图像上实现随机遮挡和特征丰富。4.根据权利要求1所述的基于改进YOLOv5模型的大分辨率图像目标检测方法，其特征在于，所述改进后的EfficientNet网络的结构包括：卷积核大小为3*3，步长为2，通道数为64，包含BN和激活函数swish的卷积层；
DSConv结构，包括1*1含BN和h
‑
sigmoid的卷积层、k*k的Dep Conv卷积层、SE模块、1*1含BN的卷积层及Dropout层，其中，k取值包括3和5两种情况，所述SE模块包括全局平均池化层和两个全连接层，对各个通道特征图进行权值设定，其中，1*1含BN的卷积层用于降维处理。5.根据权利要求1所述的基于改进YOLOv5模型的大分辨率图像目标检测方法，其特征在于，所述在骨干网络后加入BiFPN结构，包括...

【专利技术属性】
技术研发人员：黄步添，汪志刚，刘振广，焦颖颖，许曼迪，
申请(专利权)人：杭州云象网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人