一种基于多尺度图像增强和制造技术

技术编号:39673864 阅读:10 留言:0更新日期:2023-12-11 18:39
本发明专利技术涉及非机动车管理技术领域,且公开了一种基于多尺度图像增强和

【技术实现步骤摘要】
一种基于多尺度图像增强和YOLOv5s算法的雾天非机动车检测方法


[0001]本专利技术涉及非机动车管理
,具体为一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法


技术介绍

[0002]随着经济发展,我国交通系统规模不断扩大,交通道路上非机动车的数量不断增加

在道路起雾时能见度降低,导致交通事故更容易发生

另外,雾天道路摄像头所拍摄图像的对比度和辨识度较低,这会严重影响非机动车的检测精确度

因此一种能够应用于雾天场景下更精确检测非机动车的方法,对加强交管部门对非机动车的监管力度,提高雾天交通安全具有重要意义

[0003]非机动车检测,运用的检测方法以两阶段算法
R

CNN、
一阶段算法
SSD

YOLO
系列使用频率较高

两阶段算法对于检测精确度有一定的提升,但不足在于检测复杂度高和检测速度慢等;一阶段算法的泛化能力较差,对于图像中小目标的检测精确度较低且漏检率较高,需要对模型性能做进一步提升获得更好的检测效果

非机动车在驾驶场景中目标背景复杂,会出现测量目标密集分布,相互间重叠较多,导致像素少

特征不明显的特点,而
YOLO
算法对该类目标的检测性能并不理想

已有的一种基于特征蒸馏的改进 Ghost

>YOLOv5
红外目标检测算法,在牺牲少量精确度的基础上提高了检测速度,但对于雾天场景没有好的效果,为此,提出一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法


技术实现思路

[0004]本专利技术的目的在于提供一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,以解决上述
技术介绍
中提出的问题

[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,包括如下步骤:步骤
1、
对数域转化;步骤
2、
指数化;步骤
3、
图像色彩恢复;步骤
4、
图像特征提取;步骤
5、
目标特征融合;步骤
6、
非极大值抑制

[0006]作为优选,上述在步骤1中,输入雾天图像,对图像进行对数变换,将图像从线性空间转换到对数空间,从而增强图像的动态范围和细节信息,处理过程包含以下子步骤:步骤
101
:将雾天图像转换为对数域,更好地适应不同光照条件下的图像,对数转换表达公式如下所示:
其中,表示输入图像在位置处的像素值,表示对数域下的像素值;步骤
102
:将对数域图像进行高斯金字塔多尺度分解,得到多个不同尺度的图像,多尺度分解表达公式如下:其中,表示高斯金字塔在尺度下的图像,是高斯核函数,是卷积运算

[0007]作为优选,上述在步骤2中,输入图像对数域转化结果,对图像进行指数变换,将图像从对数空间转换回线性空间,处理过程包含以下子步骤:步骤
201
:将
Retinex
增强的图像进行指数归一化处理,避免增强后的图像亮度过饱和或过暗,归一化表达公式如下:其中,表示归一化后的
Retinex
增强图像,表示在尺度下的
Retinex
增强图像的平均值

[0008]步骤
202
:对多个尺度的
Retinex
增强图像进行加权融合,保留图像的细节信息,加权融合表达公式如下:其中,表示最终的
Retinex
增强图像,表示尺度下的权重

[0009]作为优选,上述在步骤3中,输入指数化处理结果,对
Retinex
增强的图像进行颜色恢复,提高图像的饱和度和自然度,增强图像的细节信息和纹理表现力,计算表达公式如下:其中,表示最终的
MSRCR
增强图像,表示输入图像,在尺度下的高斯金字塔图像,输入图像及高斯金字塔图像与
Retinex
式中一致

[0010]作为优选,上述在步骤4中,输入恢复色彩的图像,通过卷积神经网络从图像中提取特征,并将特征映射到目标检测框中,处理过程包含以下子步骤:步骤
401
:使用
Resize
算法中的双线性插值方法将输入图像大小调整为网络输入大小,具体表达公式如下:
其中,是原始输入图像,和是原始输入图像的宽度和高度,和是网络输入图像的宽度和高度,和是输出图像中像素的坐标,表示图像的通道数

[0011]步骤
402
:使用主干网络
CSPDarknet53
将输入图像通过若干个卷积层和残差块进行特征提取,通过
SPPF
模块将特征图进行不同大小的池化操作,最大池化公式如下:其中,表示输入特征图,表示池化结果,表示感受野的数量,表示输入特征图的通道数,和表示感受野的高度和宽度,表示感受野的步长;通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合

[0012]作为优选,上述在步骤5中,输入图像的特征数据,通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合,提高目标检测的准确性

适应性和效率,同时实现特征共享,避免重复计算和存储

[0013]作为优选,上述在步骤6中,输入特征融合的数据,利用非极大值抑制算法对多个重叠的检测框进行筛选和优化,提高目标检测的准确性和鲁棒性,处理过程包含以下子步骤:步骤
601
:使用
Head
网络中的三个输出层分别预测不同大小的目标框,将网络输出特征映射到目标框的坐标和类别概率,每个输出层都会输出一个的特征图,其中表示输出特征图的大小,表示每个像素点预测的目标框数量,表示目标的类别数,其预测的个目标框中,只有置信度最高的那个目标框会被保留

[0014]步骤
602
:使用
NMS
算法根据置信度筛选出置信度高于阈值的目标框,选取置信度最高的目标框作为参考框,然后对于每个类别分别执行,比较其他目标框与参考框的重叠程度,将重叠程度高于一定阈值的目标框剔除,重叠交并比计算公式如下:其中,表示当前目标框的面积,表示参考框的面积

[0015]步骤
603
:利用
Detection
检测器对处理后的目标框和类别概率输出作为检测结果,包含目标的位置和类别信息

[001本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,其特征在于:包括如下步骤:步骤
1、
对数域转化;步骤
2、
指数化;步骤
3、
图像色彩恢复;步骤
4、
图像特征提取;步骤
5、
目标特征融合;步骤
6、
非极大值抑制
。2.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,其特征在于:在步骤1中,输入雾天图像,对图像进行对数变换,将图像从线性空间转换到对数空间,从而增强图像的动态范围和细节信息,处理过程包含以下子步骤:步骤
101
:将雾天图像转换为对数域,更好地适应不同光照条件下的图像,对数转换表达公式如下所示:其中,表示输入图像在位置处的像素值,表示对数域下的像素值;步骤
102
:将对数域图像进行高斯金字塔多尺度分解,得到多个不同尺度的图像,多尺度分解表达公式如下:其中,表示高斯金字塔在尺度下的图像,是高斯核函数,是卷积运算
。3.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,其特征在于:在步骤2中,输入图像对数域转化结果,对图像进行指数变换,将图像从对数空间转换回线性空间,处理过程包含以下子步骤:步骤
201
:将
Retinex
增强的图像进行指数归一化处理,避免增强后的图像亮度过饱和或过暗,归一化表达公式如下:其中,表示归一化后的
Retinex
增强图像,表示在尺度下的
Retinex
增强图像的平均值;步骤
202
:对多个尺度的
Retinex
增强图像进行加权融合,保留图像的细节信息,加权融合表达公式如下:
其中,表示最终的
Retinex
增强图像,表示尺度下的权重
。4.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,其特征在于:在步骤3中,输入指数化处理结果,对
Retinex
增强的图像进行颜色恢复,提高图像的饱和度和自然度,增强图像的细节信息和纹理表现力,计算表达公式如下:其中,表示最终的
MSRCR
增强图像,表示输入图像,在尺度下的高斯金字塔图像
。5.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法,其特征在于:在步骤4中,输入恢复色彩的图像,通过卷积神经网络从图像中提取特征,并将特征映射到目标检测框中,处理过程包含以下子步骤:步骤
401
:使用
Resize
算法中的双线性插值方法将输入图像大小调整为网络输入大小,具体表达公式如下:其中,是原始输入图像,和是原始输入图像的宽度和高度,和是网络输入图像的宽度和高度,和是输出图像中像素的坐标,表示图像的通道数;步骤
402
:使用主干网络
CSPDarknet53
将输入图像通过若干个卷积层和残差块进行特征提取,通过
SPPF
模块将特征图进行不同大小的池化操作,最大池化公式如下:其中,表示输入特征图,表示池化结果,表示感受野的数量,表示输入特征图的通道数,和表示感受野的高度和宽度,表示感受野的步长;通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合
。6.
根据权利要求1所述的一种基于多尺度图像增强和
...

【专利技术属性】
技术研发人员:朱凤华谢磊磊郑奎李崇
申请(专利权)人:中科领航智能科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1