基于轻量化YOLOv5s模型的野外朱鹮实时检测方法技术

技术编号:39434067 阅读:9 留言:0更新日期:2023-11-19 16:17
本发明专利技术公开了一种基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,本发明专利技术的是利用EfficientNet中的MBConvBlock构建重构YOLOv5主干网络,将改进的CBAM注意力模块添加到YOLOv5的PANNet特征融合网络中,从而构建出一种基于轻量化YOLOv5s检测模型;其中改进的CBAM注意力模块由高效通道注力机制ECA模块和空间注意力模块SAM构成。本发明专利技术对基于轻量化YOLOv5s检测模型进行训练,然后再利用训练后的检测模型对朱鹮进行实时检测。本发明专利技术的检测方法准确高且大幅降低了模型的计算复杂度。方法准确高且大幅降低了模型的计算复杂度。方法准确高且大幅降低了模型的计算复杂度。

【技术实现步骤摘要】
基于轻量化YOLOv5s模型的野外朱鹮实时检测方法


[0001]本专利技术涉及一种基于轻量化YOLOv5s模型的野外朱鹮实时检测方法。

技术介绍

[0002]朱鹮,是世界上最为濒危的鸟类之一,在其保护过程中知悉其分布情况是朱鹮保护这一任务的关键环节,现阶段探寻野外朱鹮踪迹均靠相关专业人员对其潜在出现区域进行科学考察,由于朱鹮活动范围较大,且生活环境复杂,所以现有方法耗时耗力,效率较低。当前,计算机视觉发展日新月异,利用固定相机或无人机及计算机视觉技术代替人工可对朱鹮出现区域进行长期监测,自动获得某一区域朱鹮的详细出现情况。因此,使用基于计算机视觉的方法来代替人工巡察具有重要的意义。
[0003]近年来,计算机视觉中涌现出许多令人瞩目的基于深度学习的目标检测算法,这些算法可有效改善基于传统机器学习算法在进行目标检测时存在的检测精度低,抗干扰能力差,无法适应复杂环境的问题。其大致可以分为两类:一类是“两阶段检测”算法,其在执行时需要分两步完成,首先获得候选区域,然后进行区域内目标分类,标志性算法如R

CNN、Fast

R

CNN、Faster

R

CNN。另一类就是一阶段检测算法,通过目标检测网络直接预测出目标的类别和位置信息,这类基于回归的目标检测算法有YOLO系列(You Only LookOnce)、与SSD(Single shot multibox detector)。这类算法的优点是检测速度教快、实时性好,但是相比于两步检测算法精度略低,但是以上经典网络的都存在模型过大,运算量太大,难以生产部署与在移动端移植。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,该方法能够保持较高模型预测精度,同时大幅降低了模型的计算复杂度。
[0005]本专利技术是采用以下技术方案实现的:
[0006]一种基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,包括以下步骤:
[0007](1)采集野外朱鹮的图像数据,并对图像进行标注和数据增强处理,获得朱鹮图像数据库;
[0008](2)将朱鹮图像数据库中的图像按照8:2的比例划分为训练集和测试集;
[0009](3)利用EfficientNet中的MBConvBlock构建重构YOLOv5主干网络,将改进的CBAM注意力模块添加到YOLOv5的PANNet特征融合网络中,从而构建出一种基于轻量化YOLOv5s检测模型;所述改进的CBAM注意力模块由高效通道注力机制ECA模块和空间注意力模块SAM构成;
[0010](4)使用K

means聚类算法在野外朱鹮数据集中聚类出朱鹮锚框尺寸;
[0011](5)将所述训练集中的图像尺寸缩小到在320

640K范围内中的32倍数的值,输入图像尺寸保持为长宽一致;
[0012](6)将步骤(5)处理后的所述训练集图像进行Mosaic数据增强;
[0013](7)利用步骤(6)处理后的训练集图像对步骤(3)所述基于轻量化YOLOv5s检测模型进行训练,得到训练好的检测模型;
[0014](8)将待检测的野外朱鹮实时图像输入到训练好的检测模型中进行检测。
[0015]优选的,步骤(1)是将从汉中朱鹮国家级自然保护区中采集朱鹮的图像资料,使用LabelImg对图像中的朱鹮进行标注,并对图像进行旋转、正切、随机裁剪、色彩空间变换处理以实现数据增强,得到朱鹮图像数据库。
[0016]优选的,步骤(3)所述高效通道注力机制ECA模块是先将输入的特征图分别经过全局最大池化和全局平均池化,得到两个1*1*C的特征图,将数据的长与宽维度合并为一个,再使用一个共享的一维卷积在输出的特征图的通道维度方向进行卷积,而后将其输出的两个特征向量进行element

wise加和与Sigmoid激活,生成的特征向量即为原输入特征图通道维度的注意力权重。
[0017]优选的,步骤(3)所述空间注意力模块将通道注意力模块的输出特征图作为输入特征图,首先将输入特征图做全局最大池化和全局平均池化,得到两个H*W*1的特征图,将其在通道维度拼接用卷积进行特征提取,降维到1,再经过Sigmod函数生成空间注意力权重,与该模块的输入特征图进行Element

wise乘法操作重新生成特征图。
[0018]优选的,步骤(3)所述MBConvBlock是一种包含深度可分离卷积的模块,其包括:卷积核大小为1*1,步距为1的普通卷积,卷积核大小为3*3,步距为1的深度可分离卷积,SE注意力模块、卷积核大小为1*1,步距为1的普通卷积、Drop层,激活函数统一使用Swish激活函数。
[0019]优选的,步骤(3)使用Stem模块替代YOLOv5s中的focus层,Stem模块通过两个分支网络进行特征提取,具体方法如下:
[0020]输入图片,首先经过一个卷积核大小为3*3,步距为2的普通卷积,采用Relu6激活函数,再分别经过两个支路,一个支路是大小为2*2池化核,另一个支路是卷积核大小为1*1,步距为1的普通卷积,采用Silu激活函数,与卷积核大小为3*3,步距为1的普通卷积,采用Silu激活函数,然后将两个支路在通道方向拼接在一起,在通过一个是卷积核大小为3*3,步距为1的普通卷积,采用Relu6激活函数。
[0021]优选的,步骤(6)所述Mosaic数据增强是将图像中的四张照片均设置标记框,然后进行拼接后得到一张新图片,将所述新图片传入到神经网络中去学习,对拼接后的新图片中的四张图片都分别进行数据增强操作,包括左右翻转,按比例缩放,色域变化,图片中的标记框按照图像大小进行同比例缩放。
[0022]优选的,步骤(7)进行训练时需要设置网络训练初始参数,所述初始参数包括图片输入尺寸、动量参数、权重衰减正则项参数、图片角度变化参数、饱和度与曝光变化参数、色调变化参数、初始学习率以及训练迭代次数,调整动量参数、权重衰减正则项参数、始学习率以及训练迭代次数;经过训练后使得训练结果稳定,使用mAP对网络性能进行评价,得到训练好的YOLOv5

CBAM网络模型。
[0023]优选的,步骤(8)将待检测的图像输入到所述网络模型中,输出三种尺度的检测框,然后对检测框进行如下操作:
[0024]将置信度小于阈值的检测框过滤掉,接着使用非极大值抑制算法对剩下的检测框进行筛选得到最佳的朱鹮检测框;
[0025]所述非极大值预测算法具体为:首先从所有的检测框中找到置信度最大的检测框,然后逐个计算其与剩余检测框的I0U,所述I0U是两个检测框的交集除以两个检测框的并集,如果其值大于设定的阈值,就将该检测框剔除,最后留下来的就是最佳的检测框。
[0026]与现有技术相比,本专利技术具有以下有益效果:...

【技术保护点】

【技术特征摘要】
1.基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,其特征在于,包括以下步骤:(1)采集野外朱鹮的图像数据,并对图像进行标注和数据增强处理,获得朱鹮图像数据库;(2)将朱鹮图像数据库中的图像按照8:2的比例划分为训练集和测试集;(3)利用EfficientNet中的MBConvBlock构建重构YOLOv5主干网络,将改进的CBAM注意力模块添加到YOLOv5的PANNet特征融合网络中,从而构建出一种基于轻量化YOLOv5s检测模型;所述改进的CBAM注意力模块由高效通道注力机制ECA模块和空间注意力模块SAM构成;(4)使用K

means聚类算法在野外朱鹮数据集中聚类出朱鹮锚框尺寸;(5)将所述训练集中的图像尺寸缩小到在320

640K范围内中的32倍数的值,输入图像尺寸保持为长宽一致;(6)将步骤(5)处理后的所述训练集图像进行Mosaic数据增强;(7)利用步骤(6)处理后的训练集图像对步骤(3)所述基于轻量化YOLOv5s检测模型进行训练,得到训练好的检测模型;(8)将待检测的野外朱鹮实时图像输入到训练好的检测模型中进行检测。2.根据权利要求1所述基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,其特征在于,步骤(1)是将从汉中朱鹮国家级自然保护区中采集朱鹮的图像资料,使用LabelImg对图像中的朱鹮进行标注,并对图像进行旋转、正切、随机裁剪、色彩空间变换处理以实现数据增强,得到朱鹮图像数据库。3.根据权利要求1所述基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,其特征在于,步骤(3)所述高效通道注力机制ECA模块是先将输入的特征图分别经过全局最大池化和全局平均池化,得到两个1*1*C的特征图,将数据的长与宽维度合并为一个,再使用一个共享的一维卷积在输出的特征图的通道维度方向进行卷积,而后将其输出的两个特征向量进行element

wise加和与Sigmoid激活,生成的特征向量即为原输入特征图通道维度的注意力权重。4.根据权利要求1所述基于轻量化YOLOv5s模型的野外朱鹮实时检测方法,其特征在于,步骤(3)所述空间注意力模块将通道注意力模块的输出特征图作为输入特征图,首先将输入特征图做全局最大池化和全局平均池化,得到两个H*W*1的特征图,将其在通道维度拼接用卷积进行特征提取,降维到1,再经过Sigmod函数生成空间注意力权重,与该模块的输入特征图进行Element

wise乘法操作重新生成特征图。5.根据权利要求1所述基于轻量化YOLOv5s模型的野外朱鹮实...

【专利技术属性】
技术研发人员:张鹏超张凡黄俊霖王磊皇金锋
申请(专利权)人:陕西理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1