一种基于多尺度图像增强和制造技术

技术编号：39673864 阅读：10 留言：0更新日期：2023-12-11 18:39

本发明专利技术涉及非机动车管理技术领域，且公开了一种基于多尺度图像增强和

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度图像增强和YOLOv5s算法的雾天非机动车检测方法

[0001]本专利技术涉及非机动车管理
，具体为一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法
。

技术介绍

[0002]随着经济发展，我国交通系统规模不断扩大，交通道路上非机动车的数量不断增加
。
在道路起雾时能见度降低，导致交通事故更容易发生
。
另外，雾天道路摄像头所拍摄图像的对比度和辨识度较低，这会严重影响非机动车的检测精确度
。
因此一种能够应用于雾天场景下更精确检测非机动车的方法，对加强交管部门对非机动车的监管力度，提高雾天交通安全具有重要意义
。
[0003]非机动车检测，运用的检测方法以两阶段算法
R
‑
CNN、
一阶段算法
SSD
和
YOLO
系列使用频率较高
。
两阶段算法对于检测精确度有一定的提升，但不足在于检测复杂度高和检测速度慢等；一阶段算法的泛化能力较差，对于图像中小目标的检测精确度较低且漏检率较高，需要对模型性能做进一步提升获得更好的检测效果
。
非机动车在驾驶场景中目标背景复杂，会出现测量目标密集分布，相互间重叠较多，导致像素少
、
特征不明显的特点，而
YOLO
算法对该类目标的检测性能并不理想
。
已有的一种基于特征蒸馏的改进 Ghost
‑
>YOLOv5
红外目标检测算法，在牺牲少量精确度的基础上提高了检测速度，但对于雾天场景没有好的效果，为此，提出一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法
。

技术实现思路

[0004]本专利技术的目的在于提供一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，以解决上述
技术介绍
中提出的问题
。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，包括如下步骤：步骤
1、
对数域转化；步骤
2、
指数化；步骤
3、
图像色彩恢复；步骤
4、
图像特征提取；步骤
5、
目标特征融合；步骤
6、
非极大值抑制
。
[0006]作为优选，上述在步骤1中，输入雾天图像，对图像进行对数变换，将图像从线性空间转换到对数空间，从而增强图像的动态范围和细节信息，处理过程包含以下子步骤：步骤
101
：将雾天图像转换为对数域，更好地适应不同光照条件下的图像，对数转换表达公式如下所示：
其中，表示输入图像在位置处的像素值，表示对数域下的像素值；步骤
102
：将对数域图像进行高斯金字塔多尺度分解，得到多个不同尺度的图像，多尺度分解表达公式如下：其中，表示高斯金字塔在尺度下的图像，是高斯核函数，是卷积运算
。
[0007]作为优选，上述在步骤2中，输入图像对数域转化结果，对图像进行指数变换，将图像从对数空间转换回线性空间，处理过程包含以下子步骤：步骤
201
：将
Retinex
增强的图像进行指数归一化处理，避免增强后的图像亮度过饱和或过暗，归一化表达公式如下：其中，表示归一化后的
Retinex
增强图像，表示在尺度下的
Retinex
增强图像的平均值
。
[0008]步骤
202
：对多个尺度的
Retinex
增强图像进行加权融合，保留图像的细节信息，加权融合表达公式如下：其中，表示最终的
Retinex
增强图像，表示尺度下的权重
。
[0009]作为优选，上述在步骤3中，输入指数化处理结果，对
Retinex
增强的图像进行颜色恢复，提高图像的饱和度和自然度，增强图像的细节信息和纹理表现力，计算表达公式如下：其中，表示最终的
MSRCR
增强图像，表示输入图像，在尺度下的高斯金字塔图像，输入图像及高斯金字塔图像与
Retinex
式中一致
。
[0010]作为优选，上述在步骤4中，输入恢复色彩的图像，通过卷积神经网络从图像中提取特征，并将特征映射到目标检测框中，处理过程包含以下子步骤：步骤
401
：使用
Resize
算法中的双线性插值方法将输入图像大小调整为网络输入大小，具体表达公式如下：
其中，是原始输入图像，和是原始输入图像的宽度和高度，和是网络输入图像的宽度和高度，和是输出图像中像素的坐标，表示图像的通道数
。
[0011]步骤
402
：使用主干网络
CSPDarknet53
将输入图像通过若干个卷积层和残差块进行特征提取，通过
SPPF
模块将特征图进行不同大小的池化操作，最大池化公式如下：其中，表示输入特征图，表示池化结果，表示感受野的数量，表示输入特征图的通道数，和表示感受野的高度和宽度，表示感受野的步长；通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合
。
[0012]作为优选，上述在步骤5中，输入图像的特征数据，通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合，提高目标检测的准确性
、
适应性和效率，同时实现特征共享，避免重复计算和存储
。
[0013]作为优选，上述在步骤6中，输入特征融合的数据，利用非极大值抑制算法对多个重叠的检测框进行筛选和优化，提高目标检测的准确性和鲁棒性，处理过程包含以下子步骤：步骤
601
：使用
Head
网络中的三个输出层分别预测不同大小的目标框，将网络输出特征映射到目标框的坐标和类别概率，每个输出层都会输出一个的特征图，其中表示输出特征图的大小，表示每个像素点预测的目标框数量，表示目标的类别数，其预测的个目标框中，只有置信度最高的那个目标框会被保留
。
[0014]步骤
602
：使用
NMS
算法根据置信度筛选出置信度高于阈值的目标框，选取置信度最高的目标框作为参考框，然后对于每个类别分别执行，比较其他目标框与参考框的重叠程度，将重叠程度高于一定阈值的目标框剔除，重叠交并比计算公式如下：其中，表示当前目标框的面积，表示参考框的面积
。
[0015]步骤
603
：利用
Detection
检测器对处理后的目标框和类别概率输出作为检测结果，包含目标的位置和类别信息
。
[001本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，其特征在于：包括如下步骤：步骤
1、
对数域转化；步骤
2、
指数化；步骤
3、
图像色彩恢复；步骤
4、
图像特征提取；步骤
5、
目标特征融合；步骤
6、
非极大值抑制
。2.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，其特征在于：在步骤1中，输入雾天图像，对图像进行对数变换，将图像从线性空间转换到对数空间，从而增强图像的动态范围和细节信息，处理过程包含以下子步骤：步骤
101
：将雾天图像转换为对数域，更好地适应不同光照条件下的图像，对数转换表达公式如下所示：其中，表示输入图像在位置处的像素值，表示对数域下的像素值；步骤
102
：将对数域图像进行高斯金字塔多尺度分解，得到多个不同尺度的图像，多尺度分解表达公式如下：其中，表示高斯金字塔在尺度下的图像，是高斯核函数，是卷积运算
。3.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，其特征在于：在步骤2中，输入图像对数域转化结果，对图像进行指数变换，将图像从对数空间转换回线性空间，处理过程包含以下子步骤：步骤
201
：将
Retinex
增强的图像进行指数归一化处理，避免增强后的图像亮度过饱和或过暗，归一化表达公式如下：其中，表示归一化后的
Retinex
增强图像，表示在尺度下的
Retinex
增强图像的平均值；步骤
202
：对多个尺度的
Retinex
增强图像进行加权融合，保留图像的细节信息，加权融合表达公式如下：
其中，表示最终的
Retinex
增强图像，表示尺度下的权重
。4.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，其特征在于：在步骤3中，输入指数化处理结果，对
Retinex
增强的图像进行颜色恢复，提高图像的饱和度和自然度，增强图像的细节信息和纹理表现力，计算表达公式如下：其中，表示最终的
MSRCR
增强图像，表示输入图像，在尺度下的高斯金字塔图像
。5.
根据权利要求1所述的一种基于多尺度图像增强和
YOLOv5s
算法的雾天非机动车检测方法，其特征在于：在步骤4中，输入恢复色彩的图像，通过卷积神经网络从图像中提取特征，并将特征映射到目标检测框中，处理过程包含以下子步骤：步骤
401
：使用
Resize
算法中的双线性插值方法将输入图像大小调整为网络输入大小，具体表达公式如下：其中，是原始输入图像，和是原始输入图像的宽度和高度，和是网络输入图像的宽度和高度，和是输出图像中像素的坐标，表示图像的通道数；步骤
402
：使用主干网络
CSPDarknet53
将输入图像通过若干个卷积层和残差块进行特征提取，通过
SPPF
模块将特征图进行不同大小的池化操作，最大池化公式如下：其中，表示输入特征图，表示池化结果，表示感受野的数量，表示输入特征图的通道数，和表示感受野的高度和宽度，表示感受野的步长；通过
PANet
跨层特征聚合的方式将不同层次的特征信息融合
。6.
根据权利要求1所述的一种基于多尺度图像增强和
...

【专利技术属性】
技术研发人员：朱凤华，谢磊磊，郑奎，李崇，
申请(专利权)人：中科领航智能科技苏州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人