一种矿井下巷道内目标检测方法及系统技术方案

技术编号:38202740 阅读:9 留言:0更新日期:2023-07-21 16:46
本发明专利技术公开了一种矿井下巷道内目标检测方法及系统,包括:S1:利用红外相机于井下巷道内采集视频流;S2:将视频流打散成样本图像,对样本图像进行预处理,对经过预处理的样本图像进行数据标注,作为数据集;S3:构建改进YOLO

【技术实现步骤摘要】
一种矿井下巷道内目标检测方法及系统


[0001]本专利技术涉及矿井下巷道内目标检测
,具体涉及一种矿井下巷道内目标检测方法及系统。

技术介绍

[0002]基于传统视觉的目标检测主要分为以下四个步骤:第一图像的预处理,对输入的原始图像去噪、缩放、矫正等操作,为后续的检测步骤提供更易提取特征的图像;第二区域选择,使用不同大小、不同横纵比的滑动窗口依次遍历图像的各个区域;第三特征提取,利用常见的特征提取算法得到候选区域的特征向量;第四分类器分类,判断当前区域是否为待检测目标区域并判断其类别。显然,传统方法对提取图像信息存在着诸多问题:基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余手工设计的特征对于多样性的变化没有很好的鲁棒性。目标检测的一个实际应用场景就是智能汽车环境感知模块,传统的方法已经不能够满足现在的目标检测需求。
[0003]近几年基于深度学习神经网络的目标检测算法取得了很大的突破,其中主要代表就是YOLO系列检测模型。
[0004]YOLO网络主要包含了Input(输入)、Backbone(骨干网络)、Neck(颈部)、Head(头部)这四个部分。首先,图片经过输入部分数据增强等一系列操作进行预处理后,被送入主干网,主干网部分对处理后的图片提取特征;随后,提取到的特征经过Neck模块特征融合处理得到大、中、小三种尺寸的特征;最终,融合后的特征被送入检测头,经过检测之后输出得到结果。
[0005]Backbone(骨干网络)部分主要由卷积和各种模块构建而成。输入的图片首先会在主干网络里面进行特征提取,提取到的特征可以被称作特征层,是输入图片的特征集合。在主干部分,我们获取了三个特征层进行下一步网络的构建,这三个特征层称为有效特征层。
[0006]Neck(颈部)模块,在主干部分获得的三个有效特征层会在这一部分进行特征融合,结合不同尺度的特征信息,对已经获得的有效特征层继续提取特征,对特征进行上采样实现特征融合,还会对特征再次进行下采样实现特征融合。
[0007]Head(头部),选用了表示大、中、小三种目标尺寸的IDetect检测头。Head(头部)作为分类器与回归器,通过Backbone和Neck,可以获得三个加强过的有效特征层。每一个特征层都有宽、高和通道数,此时我们可以将特征图看作一个又一个特征点的集合,每个特征点上有三个先验框,每一个先验框都有通道数个特征。YoloHead对特征点进行判断,判断特征点上的先验框是否有物体与其对应。
[0008]综述,在实际部署使用时,YOLO系列网络也存在速度和精度上的差异,在矿井下巷道内也存在大量错检,漏检等现象,对于满足矿井下巷道的智能汽车环境感知模块行人及车辆检测的检测还有一定的差距。基于上述分析,本专利技术提出了一种基于改进YOLO

V7的矿井下巷道内行人及车辆检测方法及系统。

技术实现思路

[0009]针对现有技术的不足,本专利技术提出了一种矿井下巷道内目标检测方法及系统,采用深度学习网络的结构,改进YOLO

V7网络,在保证检测精度的前提下,减少了模型的参数量,提高了网络模型的检测速度,实现了实时检测的目标。
[0010]为实现上述目的,本专利技术提供了如下方案:
[0011]一种矿井下巷道内目标检测方法,包括以下步骤:
[0012]S1:利用红外相机于井下巷道内采集视频流;
[0013]S2:将所述视频流打散成样本图像,对所述样本图像进行预处理,对经过预处理的所述样本图像进行数据标注,作为数据集;
[0014]S3:构建改进YOLO

V7行人及车辆检测模型;
[0015]S4:利用所述数据集对所述改进YOLO

V7行人及车辆检测模型进行训练;
[0016]S5:对待检测的图像进行预处理,基于通过训练的所述改进YOLO

V7行人及车辆检测模型对经过预处理的所述待检测的图像进行结果的检测,最终得到检测结果。
[0017]优选的,所述S2中,对所述样本图像进行预处理的方法包括:图像的反转,随机颜色,调整饱和度,调整亮度和增强对比度。
[0018]优选的,所述S2中,对经过预处理的所述样本图像进行数据标注的方法包括:
[0019]对预处理过的所述样本图像进行行人及车辆位置框标定;
[0020]标定时框的上下左右边缘要完整包括整个预设目标,当行人及车辆在图像上显露的区域少于整个车身面积的三分之一时不做标定。
[0021]优选的,所述S2中,所述数据集划分为训练集、验证集、测试集,比例为8:1:1。
[0022]优选的,所述S3中,所述改进YOLO

V7行人及车辆检测模型以轻量化网络MobileOne为主干网络,在瓶颈中加入CBAM注意力机制。
[0023]优选的,所述S4中,利用所述数据集对所述改进YOLO

V7行人及车辆检测模型进行训练的方法包括:
[0024]S41:利用训练集对所述改进YOLO

V7行人及车辆检测模型进行训练过程中,总的迭代次数为300次,最小批次为16,线程为16,初始学习速率为0.06,利用随机梯度下降方法优化网络参数,随机梯度下降优化器的动量为0.6,权重衰减0.0004;
[0025]S42:利用测试集对所述S41已训练的所述改进YOLO

V7行人及车辆检测模型进行测试,测试所述改进YOLO

V7行人及车辆检测模型能否满足预设要求,如果能满足预设要求,则结束训练,不能满足预设要求,调整参数重新对所述改进YOLO

V7行人及车辆检测模型进行训练和测试。
[0026]本专利技术还提供了一种矿井下巷道内目标检测系统,包括:采集模块、处理模块、构建模块、训练模块和检测模块;
[0027]所述采集模块用于利用红外相机于井下巷道内采集视频流;
[0028]所述处理模块用于将所述视频流打散成样本图像,对所述样本图像进行预处理,对经过预处理的所述样本图像进行数据标注,作为数据集;
[0029]所述构建模块用于构建改进YOLO

V7行人及车辆检测模型;
[0030]所述训练模块用于利用所述数据集对所述改进YOLO

V7行人及车辆检测模型进行训练;
[0031]所述检测模块用于对待检测的图像进行预处理,基于通过训练的所述改进YOLO

V7行人及车辆检测模型对经过预处理的所述待检测的图像进行结果的检测,最终得到检测结果。
[0032]优选的,所述处理模块中,对所述样本图像进行预处理的过程包括:图像的反转,随机颜色,调整饱和度,调整亮度和增强对比度。
[0033]优选的,所述处理模块中,对经过预处理的所述样本图像进行数据标注的过程包括:
[0034]对预处理过的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种矿井下巷道内目标检测方法,其特征在于,包括以下步骤:S1:利用红外相机于井下巷道内采集视频流;S2:将所述视频流打散成样本图像,对所述样本图像进行预处理,对经过预处理的所述样本图像进行数据标注,作为数据集;S3:构建改进YOLO

V7行人及车辆检测模型;S4:利用所述数据集对所述改进YOLO

V7行人及车辆检测模型进行训练;S5:对待检测的图像进行预处理,基于通过训练的所述改进YOLO

V7行人及车辆检测模型对经过预处理的所述待检测的图像进行结果的检测,最终得到检测结果。2.根据权利要求1所述的矿井下巷道内目标检测方法,其特征在于,所述S2中,对所述样本图像进行预处理的方法包括:图像的反转,随机颜色,调整饱和度,调整亮度和增强对比度。3.根据权利要求1所述的矿井下巷道内目标检测方法,其特征在于,所述S2中,对经过预处理的所述样本图像进行数据标注的方法包括:对预处理过的所述样本图像进行行人及车辆位置框标定;标定时框的上下左右边缘要完整包括整个预设目标,当行人及车辆在图像上显露的区域少于整个车身面积的三分之一时不做标定。4.根据权利要求1所述的矿井下巷道内目标检测方法,其特征在于,所述S2中,所述数据集划分为训练集、验证集、测试集,比例为8:1:1。5.根据权利要求1所述的矿井下巷道内目标检测方法,其特征在于,所述S3中,所述改进YOLO

V7行人及车辆检测模型以轻量化网络MobileOne为主干网络,在瓶颈中加入CBAM注意力机制。6.根据权利要求4所述的矿井下巷道内目标检测方法,其特征在于,所述S4中,利用所述数据集对所述改进YOLO

V7行人及车辆检测模型进行训练的方法包括:S41:利用训练集对所述改进YOLO

V7行人及车辆检测模型进行训练过程中,总的迭代次数为300次,最小批次为16,线程为16,初始学习速率为0.06,利用随机梯度下降方法优化网络参数,随机梯度下...

【专利技术属性】
技术研发人员:孙扬李毅李勇李松段泽昊
申请(专利权)人:河北工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1