【技术实现步骤摘要】
一种基于RGB和偏振模态融合的汽车目标检测方法
[0001]本专利技术涉及计算机视觉领域中的目标检测领域,尤其涉及一种基于
RGB
和偏振模态融合的汽车目标检测方法
。
技术介绍
[0002]二维图像中的目标检测任务是计算机视觉领域的核心问题之一
。
其任务是找出图像中所有感兴趣的目标
(
物体
)
实例,确定它们的类别和位置
。
但由于不同物体在外观
、
形状和姿态上的差异,以及成像时光照
、
遮挡等因素的干扰,目标检测仍然是一项具有挑战性的任务
。
[0003]汽车检测方法是一项关键任务,是实现诸多自动驾驶
、
智能交通功能的基础性先决条件
。
不同的交通场景中的光照
、
天气和车辆密集程度等条件的显著差异仍然可以对现有的通用检测器或专用汽车检测算法造成挑战
。
因为不稳定的有限颜色信息对提取汽车的关键上下文语意特征造成了阻碍,这使得汽车检测的精度和可靠性下降,进一步无法满足安全性能需求极高的自动驾驶和智能交通任务要求
。
因此,让视觉系统能够发现并识别场景中的车辆实例,具有现实意义和应用价值
。
[0004]本专利技术主要用到了光的偏振原理
、
目标检测方法和多模态融合方法等相关技术
。
[0005](a)
光的偏振原理
[0006]光 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
RGB
和偏振模态融合的汽车目标检测方法,其特征在于,建立
PCDNet
网络,汽车检测数据集
RGB
‑
PCar
包括
RGB
信息
、AoLP
信息和
DoLP
信息,其输入至
PCDNet
网络中;所述
PCDNet
网络包括偏振整合模块
PI、
两条特征提取分支
、
材质感知记忆模块
MPM、
跨域需求查询模块
CDDQ、
特征金字塔
FPN
和检测头
Head
;
AoLP
信息和
DoLP
信息经偏振整合模块
PI
整合为偏振信息;两条特征提取分支分别为偏振处理分支和
RGB
处理分支,用于提取偏振特征和
RGB
特征;经特征提取分支提取多级偏振特征后,偏振特征经过材质感知记忆模块
MPM
获取不同材质区域在偏振属性表现中的差异和联系;
RGB
特征通过跨域需求查询模块
CDDQ
获取对偏振特征的引导,通过查询
‑
响应的方式从偏振特征获取补偿并协同
RGB
特征自身在通道维度上映射所有通道的相关关系,分配多模态特征融合的权重;最后,经过跨域需求查询模块
CDDQ
的特征馈入特征金字塔
FPN
结构交换不同等级的语义特征,并分别送入检测头生成最终的检测结果
。2.
根据权利要求1所述的基于
RGB
和偏振模态融合的汽车目标检测方法,其特征在于,所述汽车检测数据集
RGB
‑
PCar
构建过程如下:使用彩色偏振相机记录不同交通场景下的汽车,彩色偏振相机同时在三个颜色通道和四个方向上捕获像素对齐的偏振数据,并且每幅图像中的每一辆车都有对应的专业标注的边界框;所述三个颜色通道分别为
R
,
G
和
B
;所述四个方向分别为与相机所在平面的夹角等于0°
、45
°
、90
°
、135
°
;所述汽车检测数据集中的场景包括不同的天气条件
、
光照条件
、
交通环境和车辆密度场景
。3.
根据权利要求1或2所述的基于
RGB
和偏振模态融合的汽车目标检测方法,其特征在于,所述偏振整合模块
PI
包括最大值函数
、
平均值函数
、
级联操作层
、
边界提取操作层
、
加法操作
、
乘法操作
、
最大池化层和卷积层;
DoLP
信息经平均值函数和最大值函数所得值进行级联操作后,输入至第一卷积层中;
DoLP
信息经第二卷积层和最大池化层后,与第一卷积层输出进行加法操作,并与
AoLP
信息进行相乘操作后输入至第一3×3卷积层;
DoLP
信息原值与经边界提取操作层的输出相加,输入至第二3×3卷积层;第一3×3卷积层和第二3×3卷积层的输出级联后输入至第三3×3卷积层,得到偏振信息
F
pol
;所述
PI
模块表示为:模块表示为:其中,
φ
表示
AoLP
信息,
ρ
表示
DoLP
信息;表示卷积核大小为
k
×
k、
步长为
s、
且带有批正则化处理和
SiLU
激活函数的卷积层;
[
·
]
指的是通道维度上的级联操作;
MP
是核大小为5的最大池化;
E
代表使用舒尔算子的边界提取操作;表示像素级的乘法操作;
avg
和
max
分别指平均值函数和最大值函数;
σ
指的是
sigmoid
激活函数
。4.
根据权利要求3所述的基于
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。