一种基于改进YOLOv5的丁香鱼捕捞作业识别方法技术

技术编号:34940947 阅读:22 留言:0更新日期:2022-09-17 12:14
本发明专利技术涉及一种基于改进YOLOv5的丁香鱼捕捞作业识别方法,包括以下步骤:获取丁香鱼捕捞作业的监控视频数据;将所述监控视频数据转换为图像数据;将所述图像数据输入至训练好的识别模型中,得到丁香鱼捕捞作业状态;所述识别模型为引入注意力机制模块的YOLOv5网络。本实施方式将视频监控作为模型的输入,使得整个过程更为直观,将注意力机制引入到模型主干网络中,融合捕捞作业不同时期的目标信息,同时降低复杂背景的干扰,提高了模型检测精度的同时还保证了实时检测效率。同时还保证了实时检测效率。同时还保证了实时检测效率。

【技术实现步骤摘要】
一种基于改进YOLOv5的丁香鱼捕捞作业识别方法


[0001]本专利技术涉及渔船作业识别应用
,特别是涉及一种基于改进YOLOv5的丁香鱼捕捞作业识别方法。

技术介绍

[0002]丁香鱼是一种集群性强、生命周期短的中上层小型鱼类,广泛分布于我国的东海和渤海。因其肉质鲜美,营养丰富,常被用于饮食或调味品。长期以来,我国近海渔业呈现出过度捕捞的趋势,鱼类的种群结构出现了低龄化、小型化和首次性成熟等问题。因此,我国一直在不断完善限额捕捞的制度具体实施细节,以此促进管理部门、渔民和科研人员对限额制度的了解,也大大提高了渔获物监测的水平。
[0003]近年来,对于渔船作业的统计主要依靠人工记录的方法,往往会出现漏记、错记等现象,导致航次捕捞统计的结果不准确。随着深度学习的发展,渔船作业统计的关键是对几个主要的作业特征识别,识别特征的精度越高对后期的统计更加准确。因此,科学家们对渔船作业识别方法一直在不断的探索。Feng Y等通过选取渔船的方向角和速度的变化趋势作为模型的输入参数,利用BP神经网络算法识别对渔船的行为研究,识别精度为79%,但利用的数据为船位数据而不是视频数据,因此并不直观,精度有待提高。汤先峰等利用北斗渔船监控系统数据结合迁移学习和VGG16模型进行对比实验,最终实现了94.3%的精度,成功判断出拖网和刺网船,进一步辅助渔船管理。但该方法是基于渔船的轨迹判断,目标特征较少,一旦出现相似轨迹或作业方式,判断精度会有所下降,因此需进一步探索。
[0004]国内外研究渔船作业多数是基于AIS和VMS数据对渔船的作业类型和状态进行识别,其往往是基于已绘制的捕捞渔船轨迹图对渔船类型和作业状态的识别,其存在以下缺点:目标特征较少,且捕捞渔船作业种类较多,分类方式标准也不同,因此特征轨迹并不一定准确。

技术实现思路

[0005]本专利技术所要解决的技术问题是提供一种基于改进YOLOv5的丁香鱼捕捞作业识别方法,能够提高识别精度。
[0006]本专利技术解决其技术问题所采用的技术方案是:提供一种基于改进YOLOv5的丁香鱼捕捞作业识别方法,包括以下步骤:
[0007]获取丁香鱼捕捞作业的监控视频数据;
[0008]将所述监控视频数据转换为图像数据;
[0009]将所述图像数据输入至训练好的识别模型中,得到丁香鱼捕捞作业状态;所述识别模型为引入注意力机制模块的YOLOv5网络。
[0010]所述步骤(2)与步骤(3)之间,还包括对所述图像数据进行压缩处理的步骤。
[0011]所述识别模型包括:输入层,用于对所述图像数据进行Mosaic数据增强、自适应图片缩放以及K

means算法计算锚点坐标;主干网络层,用于通过切片操作增加通道数量,并
提取出特征信息;Neck层,用于使不同的特征信息之间进行相互融合,并将相互融合后的特征信息引入SENet注意力机制模块进行处理;输出层,用于输出预测结果。
[0012]所述SENet注意力机制模块包括:压缩单元,用于利用一个平均池化层将输入的H
×
W
×
C的特征信息压缩为1
×1×
C的形式;激励单元,用于使用全连接层对压缩单元压缩后的特征信息进行非线性变换;还原单元,用于将激励单元的输出与输入的H
×
W
×
C的特征信息的二维矩阵相乘还原通道维数。
[0013]所述SENet注意力机制模块的表达式为:其中,Mc(F)为特征图输出,σ()为Sigmoid函数,W1和W0分别为输入共享权重,和为利用平均池化和最大池化在空间上生成的特征映射。
[0014]所述识别模型在训练时包括以下步骤:
[0015]获取丁香鱼捕捞作业的全部视频数据;
[0016]将视频数据转换为图像数据并进行标注,并生成xml文件;
[0017]将生成的xml文件转化为txt文本形式,其中包含标注的类别和对应位置坐标;
[0018]从所述图像数据中选出训练数据,并输入至所述识别模型进行训练;
[0019]从所述图像数据中选出验证数据,对训练后的所述识别模型进行验证,当验证结果符合要求时表示所述识别模型为训练好的识别模型。
[0020]所述标注包含四类数据,分别代表人、渔网、渔筐和加工船。
[0021]有益效果
[0022]由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术将视频监控作为模型的输入,使得整个过程更为直观,本专利技术将SENet注意力机制引入到模型主干网络中,融合捕捞作业不同时期的目标信息,同时降低复杂背景的干扰,提高了模型检测精度的同时还保证了实时检测效率。
附图说明
[0023]图1是本专利技术实施方式的流程图;
[0024]图2是实施例中丁香鱼捕捞作业示意图;
[0025]图3是实施例中识别模型的网络结构示意图;
[0026]图4是实施例中SENet注意力机制模块的结构示意图;
[0027]图5是实施例中识别模型检测结果损失函数迭代图;
[0028]图6是实施例中识别模型检测的混淆矩阵结果图。
具体实施方式
[0029]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0030]本专利技术的实施方式涉及一种基于改进YOLOv5的丁香鱼捕捞作业识别方法,如图1
所示,包括以下步骤:获取丁香鱼捕捞作业的监控视频数据;将所述监控视频数据转换为图像数据;将所述图像数据输入至训练好的识别模型中,得到丁香鱼捕捞作业状态;所述识别模型为引入注意力机制模块的YOLOv5网络。本实施方式将视频监控作为模型的输入,使得整个过程更为直观,将注意力机制引入到模型主干网络中,融合捕捞作业不同时期的目标信息,同时降低复杂背景的干扰,提高了模型检测精度的同时还保证了实时检测效率。
[0031]下面通过一个具体的实施例进一步说明本专利技术。
[0032]1.数据来源和处理
[0033]根据《2021年伏休期间特殊经济品种专项捕捞许可和捕捞辅助船配套服务安排的公示》,丁香鱼限额捕捞点浙江海域。限额捕捞时间为2021年5月1日—6月15日,本实施例中丁香鱼捕捞渔船网具为双船有囊围网,图2为双船有囊围网作业示意图。其中网衣上下纲长度为300m,网口网目1.8m,囊网长度45m,最小网目5mm。
[0034]本实施例中部署型号为DS

2CD6626B

IZHS、分辨率为1920
×
1080的高清摄像头于捕捞船上,拍摄丁香鱼捕捞作业流程视频,利用其中收集到的60个视频数据,每个视频8分钟作为本实施例使用的数据。首先,将视频数据转换为图片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的丁香鱼捕捞作业识别方法,其特征在于,包括以下步骤:(1)获取丁香鱼捕捞作业的监控视频数据;(2)将所述监控视频数据转换为图像数据;(3)将所述图像数据输入至训练好的识别模型中,得到丁香鱼捕捞作业状态;所述识别模型为引入注意力机制模块的YOLOv5网络。2.根据权利要求1所述的基于改进YOLOv5的丁香鱼捕捞作业识别方法,其特征在于,所述步骤(2)与步骤(3)之间,还包括对所述图像数据进行压缩处理的步骤。3.根据权利要求1所述的基于改进YOLOv5的丁香鱼捕捞作业识别方法,其特征在于,所述识别模型包括:输入层,用于对所述图像数据进行Mosaic数据增强、自适应图片缩放以及K

means算法计算锚点坐标;主干网络层,用于通过切片操作增加通道数量,并提取出特征信息;Neck层,用于使不同的特征信息之间进行相互融合,并将相互融合后的特征信息引入SENet注意力机制模块进行处理;输出层,用于输出预测结果。4.根据权利要求3所述的基于改进YOLOv5的丁香鱼捕捞作业识别方法,其特征在于,所述SENet注意力机制模块包括:压缩单元,用于利用一个平均池化层将输入的H
×
W
×
C的特征信息压缩为1

【专利技术属性】
技术研发人员:张胜茂张佳泽唐峰华杨胜龙张衡樊伟刘洋朱文斌
申请(专利权)人:中国水产科学研究院东海水产研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1