一种基于改进YOLOX的交通监控视频车辆检测方法、系统及设备技术方案

技术编号:38718182 阅读:13 留言:0更新日期:2023-09-08 15:00
一种基于改进YOLOX的交通监控视频车辆检测方法、系统及设备,方法为:收集实验数据并将交通监控视频分成图像序列,对输入图像预处理,得到数据增强后图像;对输入图像提取特征,用MobileViT模块增强特征并输出,提高模型鲁棒性和精度;对输出的特征图,经解耦输出网络,生成车辆分类、回归和置信度预测结果,计算损失值,用Varifocal Loss作为YOLOX的置信度损失函数,解决无锚框检测器训练中前景类和背景类之间极度不平衡问题;测试阶段,将测试视频分成图像序列,输入已收敛的上述网络模型,生成测试结果;其系统及设备利用基于改进YOLOX的交通监控视频对车辆进行检测;本发明专利技术有效缓解了在交通监控视频下车辆目标尺度变化大、车辆遮挡和光照变化导致的检测精度降低的问题。辆遮挡和光照变化导致的检测精度降低的问题。辆遮挡和光照变化导致的检测精度降低的问题。

【技术实现步骤摘要】
一种基于改进YOLOX的交通监控视频车辆检测方法、系统及设备


[0001]本专利技术属于计算机视觉
,具体涉及一种基于改进YOLOX的交通监控视频车辆检测方法、系统及设备。

技术介绍

[0002]近年来,随着经济和科技的快速发展,我国交通出行结构发生巨大变化,汽车出行已成为交通常态。根据公安部统计数据,截至2022年11月底,全国汽车保有量达到了3.18亿辆,全国汽车驾驶人数达到4.15亿。日益增加的机动车辆使得城市各种交通问题逐渐加剧,交通事故、交通堵塞、环境污染等问题严重影响人们的生活和城市的整体效益。同时,日益增加的机动车辆也使得交通管理系统面临着前所未有的挑战,传统的交通管理模式和手段已不能够适应时代发展的要求,构建智慧交通已经成为未来的发展方向和研究热点。
[0003]为了构建智慧交通,需要对交通场景中复杂多样车辆的建立感知。目标检测正是一种能够在图像或视频中自动定位和识别感兴趣物体的技术,而交通监控视频作为智慧交通的重要数据来源,将交通监控视频与目标检测技术相结合,可以对摄像头拍摄的交通视频进行快速分析,评估路段交通状况,为交通管理部门进行流量监控和交通管理提供技术支持。同时,车辆检测还是车牌识别、车辆跟踪、车辆精细化等任务的必要前提。然而,由于光照、遮挡、拥堵、天气等因素的影响,在交通监控视频中准确检测出道路上的车辆仍然存在巨大挑战。因此,对交通监控视频的车辆检测算法进行深入研究,提高车辆检测精度,具有重要的研究价值和现实意义。
[0004]专利申请CN110298227A公开了一种基于深度学习的无人机航拍图像中的车辆检测方法,针对传统图像处理算法在车辆检测过程中环境干扰、光照影响等问题,改进了Faster RCNN的网络结构并应用于无人机航拍图像中的车辆检测,对于由于无人机航拍拍摄原因产生的畸变、光照影响等同样具有较好的效果。但是针对交通监控视频中在拥堵情况下车辆分布较为密集,遮挡情况下发生漏检,以及光照变化检测精度降低的问题,仍不能进一步有效的解决。

技术实现思路

[0005]为了克服上述现有技术的不足,本专利技术的目的在于提供一种基于改进YOLOX的交通监控视频车辆检测方法、系统及设备,针对交通监控视频中在拥堵情况下车辆分布较为密集,遮挡情况漏检经常发生,以及光照变化降低检测精度等问题,利用Transformer提取对遮挡和自然干扰具有较高鲁棒性的特征,使用Varifocal Loss作为YOLOX的置信度损失函数进一步提高车辆检测的精度。
[0006]为了实现上述目的,本专利技术采用的技术方案为:
[0007]基于改进YOLOX的交通监控视频车辆检测方法,包括以下步骤:
[0008]步骤1,收集交通监控图像数据,并将交通监控视频分成图像序列,对输入图像进
行预处理,得到数据增强后的图像;
[0009]步骤2,在训练阶段,对输入的图像使用主干网络提取不同尺度的特征,进一步使用MobileViT模块增强特征并输出;
[0010]步骤3,在训练阶段,对步骤2输出的不同尺度的特征图,使用PAN网络进一步增强提取的特征;
[0011]步骤4,在训练阶段,对步骤3得到的不同尺度的增强特征使用解耦输出网络Decoupled Head得到车辆分类、回归以及置信度的预测值,计算损失值。
[0012]步骤5,在测试阶段,将测试视频分成图像序列,输入到步骤1至4训练好的网络模型中,生成测试结果。
[0013]进一步地,步骤1中的图片预处理包括以下步骤:
[0014]步骤1.1,对输入图片进行缩放操作;
[0015]步骤1.2,对输入图片进行Mosaic操作;
[0016]步骤1.3,对输入图片进行Mixup操作;
[0017]进一步地,所述步骤2具体包括以下步骤:
[0018]步骤2.1,将图像输入主干网络CSPNet提取特征,由CSPLayer层输出得到特征C0、C1、C2、C3;其中特征C0是主干网络得到的浅层特征;
[0019]步骤2.2,特征C3经过MobileViT模块得到融合局部特征和全局特征的特征F;
[0020]进一步地,步骤2.2中所述得到融合局部特征和全局特征的特征F的具体方法为:
[0021]步骤2.2.a,将输入特征C3依次经过n
×
n卷积、BatchNorm层和SiLU激活函数来进一步提取局部特征;
[0022]步骤2.2.b,将步骤2.2.a得到的局部特征经过1
×
1卷积、BatchNorm层和SiLU激活函数映射到高维特征空间;
[0023]步骤2.2.c,将步骤2.2.b中得到的特征通过通道展平操作得到N个不重叠的图像块,然后输入到Transformer模块中;
[0024]步骤2.2.d,将步骤2.2.c中的图像块经过若干个堆叠的Transformer Encoder模块得到全局特征;
[0025]步骤2.2.e,将步骤2.2.d中的全局特征通过重新堆叠还原特征图,便于后续卷积操作;
[0026]步骤2.2.f,将步骤2.2.e还原后的特征图经过1
×
1卷积、BatchNorm层和SiLU激活函数得到低维空间特征,即全局特征X';
[0027]步骤2.2.g,将步骤2.2.f中的全局特征X'与特征C3通过通道拼接的方式融合,使用n
×
n卷积网络进一步融合特征并调整特征通道数量,得到特征F。
[0028]进一步地,所述步骤3的具体方法为:
[0029]步骤3.1,将步骤2.2中得到的特征F经过n
×
n卷积、BatchNorm层和SiLU激活函数得到特征fpn_out1;
[0030]步骤3.2,将步骤3.1中得到的特征F上采样至与步骤2.1中C2特征相同尺寸,并将其与特征C2拼接,经过CSPlayer层和3
×
3卷积网络,得到特征fpn_out2;
[0031]步骤3.3,将步骤3.2中得到的特征fpn_out2上采样至与步骤2.1中C1特征相同尺寸,并将其与特征C1拼接,经过CSPlayer层,得到特征pan_out1;
[0032]步骤3.4,将步骤3.3中得到的特征pan_out1经过3
×
3卷积网络与步骤3.2中得到特征fpn_out2拼接,经过CSPlayer层,得到特征pan_out2;
[0033]步骤3.5,步骤3.4得到的特征pan_out2经过3
×
3卷积网络与步骤3.1得到的特征fpn_out1拼接,经过CSPlayer层,得到特征pan_out3。
[0034]进一步,所述步骤4的具体方法为:
[0035]步骤4.1,步骤3.3得到的特征pan_out1经过解耦输出网络Decoupled Head得到分类、回归和置信度的预测值,计算损失值;
[0036]步骤4.2,步骤3.4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进YOLOX的交通监控视频车辆检测方法,其特征在于,包括以下步骤:步骤1,收集交通监控图像数据,并将交通监控视频分成图像序列,对输入图像进行预处理,得到数据增强后的图像;步骤2,对步骤1得到的数据增强后的图像进行训练,在训练阶段,对输入的图像使用主干网络提取不同尺度的特征,进一步使用MobileViT模块增强特征并输出;步骤3,在训练阶段,对步骤2输出的不同尺度的特征图,使用PAN网络进一步增强提取的特征;步骤4,在训练阶段,对步骤3得到的不同尺度的增强特征使用解耦输出网络Decoupled Head得到车辆分类、回归以及置信度的预测值,计算损失值;步骤5,对步骤4训练结果进行测试,在测试阶段,将测试视频分成图像序列,输入到步骤1至4训练好的网络模型中,生成测试结果。2.如权利要求1所述的基于改进YOLOX的交通监控视频车辆检测方法,其特征在于,步骤1中所述图片预处理按以下步骤进行:步骤1.1,对输入图片进行缩放操作;步骤1.2,对输入图片进行Mosaic操作;步骤1.3,对输入图片进行Mixup操作。3.如权利要求1所述的基于改进YOLOX的交通监控视频车辆检测方法,其特征在于,所述步骤2具体包括以下步骤:步骤2.1,将图像输入主干网络CSPNet提取特征,由CSPLayer层输出得到特征C0、C1、C2、C3;其中特征C0是主干网络得到的浅层特征;步骤2.2,将特征C3经过MobileViT模块得到融合局部特征和全局特征的特征F。4.如权利要求3所述的一种基于改进YOLOX的交通监控视频车辆检测方法,其特征在于,步骤2.2中所述得到融合局部特征和全局特征的特征F的具体方法为:步骤2.2.a,将输入特征C3依次经过n
×
n卷积、BatchNorm层和SiLU激活函数来进一步提取局部特征;步骤2.2.b,将步骤2.2.a得到的局部特征经过1
×
1卷积、BatchNorm层和SiLU激活函数映射到高维特征空间;步骤2.2.c,将步骤2.2.b中得到的特征通过通道展平操作得到N个不重叠的图像块,然后输入到Transformer模块中;步骤2.2.d,将步骤2.2.c中的图像块经过若干个堆叠的Transformer Encoder模块得到全局特征;步骤2.2.e,将步骤2.2.d中的全局特征通过展平逆操作重新堆叠还原特征图,便于后续卷积操作;步骤2.2.f,将步骤2.2.e还原后的特征图经过1
×
1卷积、BatchNorm层和SiLU激活函数得到低维空间特征,即全局特征X';步骤2.2.g,将步骤2.2.f中的全局特征X'与特征C3通过通道拼接的方式融合,使用n
×
n卷积网络进一步融合特征并调整特征通道数量,得到特征F。5.如权利要求1所述的基于改进YOLOX的交通监控视频车辆检测方法,其特征在于,所述步骤3的具体方法为:
步骤3.1,将步骤2.2中得到的特征F经过3...

【专利技术属性】
技术研发人员:刘如意曹泽苗启广权义宁刘向增宋建锋李宇楠
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1