基于通道非降维注意力机制与改进YOLOv5的ESB-YOLO模型养殖鱼群检测方法技术

技术编号:36604525 阅读:13 留言:0更新日期:2023-02-04 18:24
基于通道非降维注意力机制与改进YOLOv5的ESB

【技术实现步骤摘要】
基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法


[0001]本专利技术属于计算机视觉领域,特别涉及基于通道非降维注意力机制与改进 YOLOv5的ESB

YOLO模型养殖鱼群检测方法。

技术介绍

[0002]随着工厂鱼类养殖的发展,养殖鱼群目标检测在指导鱼类养殖生产、辅助养殖决策等任务中起到重要作用。传统养殖鱼群检测基于人工,费时费力且会对鱼体造成损伤,不利于鱼类养殖。目前,基于计算机视觉技术的目标检测算法成为主流,目标检测算法可以实现养殖鱼群的无接触检测,不会对鱼体造成损伤,不影响鱼类养殖效果,解决了人工检测的不足。
[0003]现有基于计算机视觉技术的水下目标检测方法,通过将检测目标图像输入网络模型进行分类后采用非极大值抑制算法筛选目标,得到水下检测目标的位置与分类信息。目前计算机视觉技术目标检测方法中YOLO系列算法效果较为优秀, YOLO算法使用预定义候选框,通过回归产生物体类别概率和位置坐标,步骤精简,计算量较小,检测速度快。其中YOLOv5是常用的计算机视觉神经网络, YOLOv5算法可根据检测任务的需求提供不同复杂化度的网络模型,具有较好的检测效果与较快的检测速度,在水下目标检测领域有广泛应用。Chen通过改进特征融合网络,在不降低模型速度的条件下提高检测精度,但未解决鱼类特征提取困难问题,检测精度较低(Chen Lingyu,Zheng Meicheng,Duan Shunqiang,et al. Underwater Target Recognition Based on Improved YOLOv4 Neural Network[J]. Electronics,2021,10(14):1634

1634);Wang Q研究表明,SKNet注意力机制降维捕捉所有通道交互的方法使不相关通道进行交互,让通道之间的依赖变得低效,使模型变得复杂,增加计算量,导致模型效率降低(Wang Q,Wu B,Zhu P.et al. ECA

Net:Efficient channel attention for deep convolutional neural networks[J]. Proceedings of the IEEE Computer Society Conference on Computer Vision andPattern Recognition,2020,:11531

11539.);Wang Chunguang使用非降维通道注意力机制ECA

Net,解决了降维对注意力机制的影响(Wang Chunguang,ZhouYulin,Li Junjie.Lightweight Yolov4 Target Detection Algorithm Fused with ECAMechanism[J].Processes,2022,10(7):1285

1285.)。SKNet与ECA

Net只考虑通道注意力,没有考虑特征图任意两个位置的空间依赖关系,对特征权重分配考虑不全面。
[0004]在实际鱼类养殖环境中,由于养殖环境灯光、水体气泡等因素,导致养殖鱼图像中存在目标模糊与气泡遮挡等现象,这类现象导致YOLOv5算法无法有效提取养殖鱼的特征信息,进而出现养殖鱼目标漏检的情况,使养殖鱼的目标检测结果存在误差,使用这样的目标检测结果指导鱼类养殖生产、辅助养殖决策时会造成误判的情况。

技术实现思路

[0005]为了克服现有技术中存在的不足,本专利技术提供了基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法。通过改进YOLOv5算法,增加通道非降维双重注意力机制ECBAM模块、使用SPPF模块替换SPP模块、以及使用BiFPN模块替换PANet模块,最终构建了基于通道非降维注意力机制与改进YOLOv5的养殖鱼群检测模型ESB

YOLO(ECBAM

SPPF

BiFPN

YOLO)。 ESB

YOLO模型通过通道非降维双重注意力机制ECBAM模块提升了YOLOv5 算法中骨干网络的鱼类特征提取能力;通过BiFPN模块提升了YOLOv5算法中特征融合网络的特征融合能力;并通过SPPF模块与BiFPN模块的轻量化设计降低了ECBAM模块带来的计算量。本专利技术相较于YOLOv5算法,在提升目标检测效果的同时,没有增加模型的计算时间;缓解了现有水下检测方法面对目标模糊与气泡遮挡问题造成的目标检测精度不高的问题,提升了养殖鱼群目标检测效果。
[0006]本专利技术的技术方案为:
[0007]基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法,其特征在于,应用基于通道非降维注意力机制与改进YOLOv5的养殖鱼群检测模型ESB

YOLO,所述ESB

YOLO模型具体包括:输入端、骨干网络、特征融合网络和输出端;所述检测方法包括步骤如下:
[0008]步骤1,将待检测图像输入到所述ESB

YOLO模型的输入端,对待检测图像进行预处理,得到预处理后的图像;
[0009]步骤2,将所述预处理后的图像输入到所述ESB

YOLO模型的骨干网络中,通过YOLOv5模型骨干网络的Focus模块、卷积单元和C3模块后,经过快速空间金字塔池化SPPF模块、C3模块,之后进入到通道非降维双重注意力机制 ECBAM模块,对所述预处理后的图像进行特征提取,获得具有细节、定位信息的底层特征和具有语义信息的高层特征;
[0010]步骤3,将所述底层特征与高层特征输入到所述ESB

YOLO模型的特征融合网络中,在三个检测深度上获得含有高细节、高语义、定位信息的融合特征;
[0011]步骤4,将所述融合特征输入到所述ESB

YOLO模型的输出端,进行结果预测与筛选,得到最终的预测结果,实现养殖鱼群的目标检测。
[0012]进一步地,所述ESB

YOLO模型的骨干网络的输入为输入端的输出,骨干网络首先经Focus模块对输入的预处理后的图像进行横纵向切片再拼接,然后将拼接后的输出依次经过第一卷积单元、第一C3模块、第二卷积单元、第二C3 模块、第三卷积单元、第三C3模块、第四卷积单元,获得特征图,其中C3模块用于对卷积单元输出的残差特征进行1x1和3x3卷积学习,接着将特征图输入到SPPF模块通过3个池化核为5的最大池化,将任意大小的特征图转换成固定大小的特征向量,SPPF模块可以减少模型计算量,提高模型效率,经过第四C3 模块后,特征向量经过ECBAM模块标注重点特征信息,包括重点检测目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法,其特征在于,应用基于通道非降维注意力机制与改进YOLOv5的养殖鱼群检测模型ESB

YOLO,所述ESB

YOLO模型具体包括:输入端、骨干网络、特征融合网络和输出端;所述检测方法包括步骤如下:步骤1,将待检测图像输入到所述ESB

YOLO模型的输入端,对待检测图像进行预处理,得到预处理后的图像;步骤2,将所述预处理后的图像输入到所述ESB

YOLO模型的骨干网络中,通过YOLOv5模型骨干网络的Focus模块、卷积单元和C3模块后,经过快速空间金字塔池化SPPF模块、C3模块,之后进入到通道非降维双重注意力机制ECBAM模块,对所述预处理后的图像进行特征提取,获得具有细节、定位信息的底层特征和具有语义信息的高层特征;步骤3,将所述底层特征与高层特征输入到所述ESB

YOLO模型的特征融合网络中,在三个检测深度上获得含有细节、语义、定位信息的融合特征;步骤4,将所述融合特征输入到所述ESB

YOLO模型的输出端,进行结果预测与筛选,得到最终的预测结果,实现养殖鱼群的目标检测。2.根据权利要求1所述基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法,其特征在于,所述ESB

YOLO模型的骨干网络的输入为输入端的输出,骨干网络首先经Focus模块对输入的预处理后的图像进行横纵向切片再拼接,然后将拼接后的输出依次经过第一卷积单元、第一C3模块、第二卷积单元、第二C3模块、第三卷积单元、第三C3模块、第四卷积单元,获得特征图,其中C3模块用于对卷积单元输出的残差特征进行1x1和3x3卷积学习,接着将特征图输入到SPPF模块通过3个池化核为5的最大池化,将任意大小的特征图转换成固定大小的特征向量,再经过第四C3模块,最后特征向量经过ECBAM模块标注重点特征信息,包括重点检测目标以及重点检测目标的定位信息,获得底层特征和高层特征。3.根据权利要求2所述基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法,其特征在于,所述通道非降维双重注意力机制ECBAM模块组合通道注意力子模块与空间注意力子模块,所述ECBAM模块中操作顺序具体为:经第四C3模块输出的特征向量输入到ECB AM模块后,先通过通道注意力子模块,再通过空间注意力子模块,获得所述底层特征和高层特征,完成特征提炼。4.根据权利要求3所述基于通道非降维注意力机制与改进YOLOv5的ESB

YOLO模型养殖鱼群检测方法,其特征在于,所述通道注意力子模块具体包括:平均池化操作、最大池化操作、一维卷积、Sigmiod激活函数以及expand维度扩展函数,输入到ECBAM模块的特征向量首先通过平均池化和最大池化操作,然后在大小为k的局部跨通道交互范围内,通过卷积核大小为k的一维卷积操作实现通道信息聚合,接着依次通过Sigmiod激活函数以及expand维度扩展函数,最后获得重点目标检测信息,并将重点目标检测信息与所述特征向量进行元素乘积,获得标记有重点检测目标的...

【专利技术属性】
技术研发人员:于红韦思学张鹏高浩天张鑫李海清胡泽元吴俊峰孟娟
申请(专利权)人:大连海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1