基于改进YOLOv5的车顶关键部件定位方法及系统技术方案

技术编号:39324384 阅读:10 留言:0更新日期:2023-11-12 16:03
本发明专利技术公开了一种基于改进YOLOv5的车顶关键部件定位方法及系统,该方法在原YOLOv5算法技术上,使用Ghost卷积替换主干网络中原有的卷积层,使模型更加轻量化;引入SE注意力机制,提升对重要特征的关注度;采用CIOU_Loss作为损失函数,使预测框更加符合真实框。该系统包括数据集构建模块、图像预处理模块、模型轻量化及特征提取优化模块、特征融合模块、网络结构模型构建模块、模型训练模块和图像检测模块。本发明专利技术具有检测精度高、检测速度快,对于车顶图像质量依赖低的优点。顶图像质量依赖低的优点。顶图像质量依赖低的优点。

【技术实现步骤摘要】
基于改进YOLOv5的车顶关键部件定位方法及系统


[0001]本专利技术属于交通安全工程
,具体地说,是一种基于改进YOLOv5的车顶关键部件定位方法及系统。

技术介绍

[0002]随着我国铁路系统的高速发展,列车的运行安全问题越来越为人们所重视。在通过式机车检测中,受电弓等车顶关键部件的识别检测作为机车检测的一个重要环节,已经受到了广泛的关注。列车车顶部件存在着一系列可能发生的故障以及隐患,如受电弓磨损变形,避雷器破裂和空调外机剥落等,可能会使列车运行故障。因此车顶设备状态在线检测系统对于列车安全运行具有重要的意义。
[0003]车顶设备状态检测的方式有人工检测法和基于图像处理的检测技术。人工检测的方法是等待列车进入车辆段后,经过停车、降弓、断电等一系列操作后,由工作人员登上车顶借助简单辅助工具,查看车顶表面是否存在异物、关键部件是否发生故障等。人工检测法存在检测效率低、产生二次异物、存在一定安全隐患等问题,已经无法满足对当今安全运营的需求。
[0004]基于图像处理的检测技术,通过采集清晰完整的车顶图像数据,定位车顶的关键部件,然后对其进行处理分析,实现对车顶设备状态检测和异物检测的需求,中国铁路设计集团有限公司的王永强通过3台线阵相机获取车顶图像,利用Hough对受电弓过滑板及瓷瓶进行定位,采用ECC配准、模版匹配、结构相似度评估等方法对关键部件进行缺损检测,存在运行速度慢,实时性差的问题。天津的王业超通过HTM神经网络算法对列车车顶的关键部件进行结构学习,构建车顶关键部件的数据模版库,在实际检测时,通过与数据模版库中的关键部件进行实时对比,判别关键部件是否异常,在精度方面有待提高。

技术实现思路

[0005]本专利技术的目的在于提供一种准确率高、检测速率快的基于改进YOLOv5的车顶关键部件定位方法及系统。
[0006]实现本专利技术目的的技术解决方案是:一种基于改进YOLOv5的车顶关键部件定位方法,包括以下步骤:
[0007]步骤1、采集列车车顶图像,对图像中包括受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶的车顶关键部件进行标注,对采集的车顶图像进行数据增强,构建数据集;
[0008]步骤2、采用YOLOv5算法的Head部分,对步骤1采集到的未标注原始车顶图像进行预处理,包括Mosaic数据增强、自适应锚框计算和自适应图片缩放;
[0009]步骤3、优化YOLOv5算法的Backbone主干网络部分,采用GhostBottleneck模块替换Backbone中原本的CSP1_X模块,使模型轻量化;添加SE注意力机制到Backbone末端;
[0010]步骤4、采用YOLOv5算法的Neck部分,进行特征融合;
[0011]步骤5、在YOLOv5算法的预测部分,采用CIoU_Loss替代GIOU_Loss作为定位损失函数,得到改进YOLOv5的网络结构模型;
[0012]步骤6、采用步骤1标注的数据集,通过步骤2~步骤5构成的网络结构模型训练数据并验证性能;
[0013]步骤7、使用步骤6模型训练后得到的best.pt权重文件对待测车顶图像进行检测,输出车顶关键部件定位检测结果。
[0014]一种基于改进YOLOv5的车顶关键部件定位系统,包括数据集构建模块、图像预处理模块、模型轻量化及特征提取优化模块、特征融合模块、网络结构模型构建模块、模型训练模块和图像检测模块,其中:
[0015]数据集构建模块,用于采集列车车顶图像,对图像中包括受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶的车顶关键部件进行标注,对采集的车顶图像进行数据增强,构建数据集;
[0016]图像预处理模块,采用YOLOv5算法的Head部分,对采集到的未标注原始车顶图像进行预处理,包括Mosaic数据增强、自适应锚框计算和自适应图片缩放;
[0017]模型轻量化及特征提取优化模块,优化YOLOv5算法的Backbone主干网络部分,采用GhostBottleneck模块替换Backbone中原本的CSP1_X模块,使模型轻量化;添加SE注意力机制到Backbone末端;
[0018]特征融合模块,采用YOLOv5算法的Neck部分,进行特征融合;
[0019]网络结构模型构建模块,在YOLOv5算法的预测部分,采用CIoU_Loss替代GIOU_Loss作为定位损失函数,得到改进YOLOv5的网络结构模型;
[0020]模型训练模块,采用数据集构建模块标注的数据集,通过网络结构模型训练数据并验证性能;
[0021]图像检测模块,使用模型训练后得到的best.pt权重文件对待测车顶图像进行检测,输出车顶关键部件定位检测结果。
[0022]一种移动终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于改进YOLOv5的车顶关键部件定位方法。
[0023]一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现所述基于改进YOLOv5的车顶关键部件定位方法中的步骤。
[0024]本专利技术与现有技术相比,其显著优点为:(1)相对于原始YOLOv5算法,使用Ghost卷积替换主干网络中原有的卷积层,用更少的参数生成更多的特征,提高了检测速度;(2)相对于原始YOLOv5算法,引入SE注意力机制和CIOU_Loss作为损失函数,提高了检测精度。
附图说明
[0025]图1是YOLOv5算法网络结构图。
[0026]图2是本专利技术方法改进后的YOLOv5算法网络结构图。
[0027]图3是本专利技术方法流程示意图。
[0028]图4是本专利技术示例中各关键部件的mAP值柱状图。
[0029]图5是本专利技术方法一部分检测结果图。
[0030]图6是本专利技术方法另一部分检测结果图。
具体实施方式
[0031]YOLOv5是YOLO系列发展至今的第五代检测算法,它在更加轻量化的同时提供了更高的检测精度,现已称为该系列中性能最优的算法,在工程应用中取得了出色的效果。车顶关键部件的准确定位是基于图像处理的实现车顶设备状态检测的关键,本文主要针对高速行驶的列车的车顶关键部件进行识别与检测,为了满足对检测实时性的要求,选用更加轻量化的YOLOv5s作为基准模型,方便后续在嵌入式设备中的应用,引入GhostBottleneck模块以及SE注意力模块改进模型,实现对车顶天线、避雷器、瓷瓶以及受电弓的识别定位,不仅识别所需时间很短,而且提高了识别的精度,在实用性方面效果良好。
[0032]本专利技术一种基于改进YOLOv5的车顶关键部件定位方法,其特征在于,包括以下步骤:
[0033]步骤1、采集列车车顶图像,对图像中包括受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶的车顶关键部件进行标注,对采集的车顶图像进行数据增强,构建数据集;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的车顶关键部件定位方法,其特征在于,包括以下步骤:步骤1、采集列车车顶图像,对图像中包括受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶的车顶关键部件进行标注,对采集的车顶图像进行数据增强,构建数据集;步骤2、采用YOLOv5算法的Head部分,对步骤1采集到的未标注原始车顶图像进行预处理,包括Mosaic数据增强、自适应锚框计算和自适应图片缩放;步骤3、优化YOLOv5算法的Backbone主干网络部分,采用GhostBottleneck模块替换Backbone中原本的CSP1_X模块,使模型轻量化;添加SE注意力机制到Backbone末端;步骤4、采用YOLOv5算法的Neck部分,进行特征融合;步骤5、在YOLOv5算法的预测部分,采用CIoU_Loss替代GIOU_Loss作为定位损失函数,得到改进YOLOv5的网络结构模型;步骤6、采用步骤1标注的数据集,通过步骤2~步骤5构成的网络结构模型训练数据并验证性能;步骤7、使用步骤6模型训练后得到的best.pt权重文件对待测车顶图像进行检测,输出车顶关键部件定位检测结果。2.根据权利要求1所述的基于改进YOLOv5的车顶关键部件定位方法,其特征在于,所述步骤1具体包括:步骤1.1、在列车检测区间配置高清工业相机,当列车通过时,启动相机对车顶图像进行连续拍摄,获取列车车顶的高清图像,后经过人工挑选,挑选包含受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶的图像;步骤1.2、对挑选后的图像,利用LabelImg工具分别对图像中受电弓滑板、空调外机、空调固定螺帽、空调螺栓、天线、避雷器和瓷瓶进行标注;步骤1.3、对标注后的车顶图像按照8:2的比例划分为训练集和验证集。3.根据权利要求1所述的基于改进YOLOv5的车顶关键部件定位方法,其特征在于,所述步骤3具体包括:步骤3.1、引入轻量级网络GhostNet替换主干网络中CSP1结构的残差模块;步骤3.1.1、GhostNet首先使用标准卷积获得原始的输出,表示为:Y=X*f+b其中给定输入数据X∈R
(c
×
h
×
w)
,*表示卷积运算,f为该层的卷积滤波器,b是偏置项,Y是输出,c是输入通道的数量,h和w分别是输入数据的高度和宽度;步骤3.1.2、使用一次卷积生成m个固有特征图:Y

=X

*f

其中Y

∈R
(h1
×
w1
×
m)
是输出,X

表示输入数据,f

表示该层的卷积滤波器,h1和w1分别是输入数据的高度和宽度,m为固有特征图个数;步骤3.1.3、再对输出使用一系列线性变换操作转化成若干组5*5大小的卷积核,表示为:y
ij
=φ
i,j
(y
i

)其中φ
i,j
表示线性运算,y
i

表示步骤3.1.2输出的第i个固有特征图,y
ij
表示卷积核,i表示固有特征图序号,j表示通道序号;
步骤3.1.4、再进行两次融合操作,不改变输出的特征图数量;步骤3.2、在YOLOv5算法基础上融合SE注意力机制;步骤3.2.1、对输入进行一个卷积操作生成特征图,接着进行压缩操作,将特征图进行全局平均池化,将每个通道的H*W个像素值u压缩为一个实数,生成一个1*1...

【专利技术属性】
技术研发人员:朱俊霖吕晨漆琛吴泽宇李洪唐磊王学慧邢成雷邢宗义
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1