一种基于深度学习和目标检测结合的轨道障碍物检测方法技术

技术编号:38381329 阅读:11 留言:0更新日期:2023-08-05 17:39
本发明专利技术公开了一种基于深度学习和目标检测结合的轨道障碍物检测方法,涉及计算机视觉领域。在构建了真实场景下的轨道交通数据库后,首先对YOLOv3的主干特征提取网络进行修改,使用ResneXt50替换原Resnet50网络,使得模型的特征提取能力更强;然后采用自适应特征融合优化方法,更为精准地检测不同尺度的目标,在保证算法实时性的同时大幅度提升算法检测性能;最后在各个检测端使用注意力机制整合不同的通道信息,并采用CIOU损失函数更为精准的回归预测框,使得检测精度进一步提高。该方法在保证算法检测速度的同时,实现了对铁路障碍物尤其是小目标进行精准高效地检测,以确保行车安全。车安全。车安全。

【技术实现步骤摘要】
一种基于深度学习和目标检测结合的轨道障碍物检测方法


[0001]本专利技术属于计算机视觉识别专利
,更具体地,涉及种基于深度学习和目标检测结合的轨道障碍物检测方法。

技术介绍

[0002]目标检测是计算机视觉的重要研究内容之一,在人脸识别、无人驾驶、航拍跟踪等方面有着广泛应用。然而在实际的轨道交通场景中,光照条件、天气状况、背景复杂度和目标大小等复杂多变,所以对算法的检测速度和精度有着更为严格的要求。
[0003]现有的目标检测算法可以分为传统的目标检测算法和基于深度学习的目标检测算法。传统的目标检测算法提取特征需要人工设定,过于依赖设计者的经验且无法自动地提取特征。基于深度学习的目标检测算法可以通过卷积神经网络自动地提取更高层特征,较传统算法的检测效果更好。基于深度学习的目标检测算法又可分为单阶段目标检测算法和双阶段目标检测算法两类。
[0004]双阶段目标检测算法虽然检测精度较高,但其计算过于繁琐复杂,导致其检测速度很慢,无法在复杂的铁路环境中实时检测障碍物以保障行车安全。相比之下单阶段目标检测算法的结构更为简单,实时性提升巨大,但是检测精度较低,尤其是小目标检测能力更弱。因此,本文提出了一种基于单阶段目标检测算法YOLOv3改进的高铁防撞设备及方法(Railway

Net),能够在保持算法速度的同时,提升算法的检测精度,尤其是增强了算法在复杂铁路环境中对小目标的检测能力。

技术实现思路

[0005]本专利技术需要解决的问题是:在光照、天气背景复杂度和目标大小等复杂多变的实际铁轨环境中,大幅度提升算法的目标检测精度,对轨道障碍物进行准确高效地检测,尤其是精准地检测小目标物体,进而保证行车安全。
[0006]本专利技术的解决方案是:构建实际场景下的轨道交通数据集,创新性地提出Railway

Net轨道障碍物检测网络,由主干特征提取模块、自适应特征融合模块和通道注意力模块组成。首先,将文献1“J.Redmon and A.Farhadi,“YOLOv3:An incremental improvement,”in Conference on Computer Vision and Pattern Recognition,2018”所述的YOLOv3算法中由文献2“He K M,Zhang X,Ren S,et al.Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition.2016:770

778.”所提出的Resnet50主干特征提取网络,替换为文献3所述的“Xie S,Girshick R,Doll
á
r P,et al.Aggregated residual transformations for deep neural networks[C]//Computer Vision and Pattern Recognition(CVPR),2017IEEE Conference on.IEEE,2017:5987

5995.”ResneXt50主干特征提取网络,并将其分为Conv1、Conv2、Conv3、Conv4和Conv5模块,分别进行下采样和特征图维度的扩张,提取更丰富、更高层次的信息,其中Conv1表示一个大小尺寸为7
×
7、通道数
为64、步长为2的卷积;Conv2表示一个大小尺寸为3
×
3、采用最大池化、步长为2的卷积和3个卷积组,每个卷积组包括一个大小尺寸为1
×
1、通道数为128的卷积,以及一个大小尺寸为3
×
3、通道数为128、分组数为32的卷积和一个大小尺寸为1
×
1、通道数为256的卷积;Conv3表示3个卷积组,每个卷积组包括一个大小尺寸为1
×
1、通道数为256的卷积,以及一个大小尺寸为3
×
3、通道数为256、分组数为32的卷积和一个大小尺寸为1
×
1、通道数为512的卷积;Conv4表示3个卷积组,每个卷积组包括一个大小尺寸为1
×
1、通道数为512的卷积,以及一个大小尺寸为3
×
3、通道数为512、分组数为32的卷积和一个大小尺寸为1
×
1、通道数为1024的卷积;Conv5表示3个卷积组,每个卷积组包括一个大小尺寸为1
×
1、通道数为1024的卷积,以及一个大小尺寸为3
×
3、通道数为1024、分组数为32的卷积和一个大小尺寸为1
×
1、通道数为2048的卷积;然后采用文献4“Song T L,Di H,and Yun H W,“Learning spatial fusion for single

shot object detection.”2019,arXiv:1911.09516.[Online].Available:https://arxiv.org/abs/1911.09516.”所述ASFF自适应特征融合优化方法,更为精准地检测不同尺度的目标,在保证算法实时性使得算法的检测性能尤其是对小目标的检测精度大幅度提高;最后在各个检测端使用通道注意力机制对不同的通道信息进行整合,自适应地重新校准通道的特征响应,并采用文献5“Zheng,Z.,et al."Distance

IoU Loss:Faster and Better Learning for Bounding Box Regression."AAAI Conference on Artificial Intelligence,2020.”所述CIOU损失函数更为精准地回归预测框,使得检测精度进一步提高。与文献1所提出的YOLOv3和文献6“A.Bochkovskiy,C.

Y.Wang,and H.

Y.M.Liao,
“‘
YOLOv4:Optimal speed and accuracy of object detection,
’”
2020,arXiv:2004.10934.[Online].Available:http://arxiv.org/abs/2004.10934.”所述YOLOv4模型对比试验表明,该方法在保证算法检测速度的同时,实现了对铁路障碍物精准高效地检测,尤其大幅度提升了小目标检测精度,以保证行车安全。
[0007]本专利技术实现上述解决方案的方法步骤为:
[0008]1.在真实的轨道交通场景中进行图像采集并构建数据库,数据库中包含不同天气和背景下的铁路交通图像和多种铁轨目标检测类别。
[0009]2.将YOLOv3本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习和目标检测结合的轨道障碍物检测方法,其特征是:在实际轨道交通场景中进行图像采集并构建数据库后,创新性地将YOLOv3的基础特征提取网络Resnet50替换为ResneXt50,使得模型提取到更丰富、更高层次的特征信息;然后采用自适应特征融合优化方法,更为精准地检测不同尺度的目标,在保证算法实时性使得算法的检测性能尤其是对小目标的检测精度大幅度提升;最后在各个检测端使用通道注意力机制对不同的通道信息进行整合,并采用CIOU损失函数更为精准地回归预测框,使得检测精度进一步提高,该方法在保证算法检测速度的同时,可以对铁路障碍物尤其是小目标进行精准高效地检测,以保证行车安全,具体步骤包括:(1)构建不同天气状况和背景下的轨道交通数据集,数据集为在真实的铁路交通环境中采集,包含铁路环境中的列车、左转轨道、右转轨道、直行轨道、行人、安全帽、扳手等多种目标,其中安全帽和扳手是难以检测的小目标;(2)优化YOLOv3的主干特征提取网络Resnet50为ResneXt50进行下采样和更丰富的特征提取,新的主干特征提取网络可分为5个模块:Conv1、Conv2、Conv3、Conv4和Conv5,在扩张特征维度的同时,将图像的分辨率分别缩减为原图的1/2,1/4,1/8,1/16和1/32;其中Conv1表示一个大小尺寸为7
×
7、通道数为64、步长为2的卷积;Conv2表示一个大小尺寸为3
×
3、采用最大池化、步长为2的卷积和3个卷积组,每个卷积组包括一个大小尺寸为1
×
1、通道数为128的卷积,以及一个大小尺寸为3
×
3、通道数为128、分组数为32的卷积和一个大小尺寸为1
×
1、通道数为256的卷积;Conv3表示3...

【专利技术属性】
技术研发人员:叶涛赵宗扬郑志康陈浩然
申请(专利权)人:中国矿业大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1