一种基于多层特征融合的多光谱行人检测方法技术

技术编号:31799266 阅读:32 留言:0更新日期:2022-01-08 10:59
本发明专利技术涉及一种基于多层特征融合的多光谱行人检测方法,属于目标检测领域,S1:对数据集进行预处理,划分为训练集和测试集,并扩充训练图像;S2:采用卷积神经网络构建多层特征融合的特征提取模型,采用通道注意力机制对可见光与红外特征进行多层特征融合,根据多层融合特征构建特征金字塔;S3:引用自适应融合机制对待检测特征层的特征图尺度进行调整,通过多尺度检测获得行人边界框;S4:通过非极大值抑制算法进行筛选,去除置信度较低的边界框并输出最终的检测结果。本发明专利技术能够提取到更多细节信息,检测性能得以进一步提升,模型在全天候场景下行人检测的准确率得到大幅度提升。候场景下行人检测的准确率得到大幅度提升。候场景下行人检测的准确率得到大幅度提升。

【技术实现步骤摘要】
一种基于多层特征融合的多光谱行人检测方法


[0001]本专利技术属于目标检测领域,涉及一种基于多层特征融合的多光谱行人检测方法。

技术介绍

[0002]现阶段,依据特征提取方式不同可将行人检测方法划分为两类:第一类为基于传统手工特征提取的检测方法,此类方法是采用预先设定的特征提取算子获得待检测物体的特征信息;第二类为基于深度学习的检测方法,此类方法是通过自学习的方式获取待检测物体的目标信息。
[0003]基于传统手工特征提取的检测方法:首先,使用滤波器获得待检测图像中目标物体的关键点信息;然后,计算每个关键点与其相邻像素间的梯度值并由此生成统计直方图;最后,使用支持向量机(SVM)或Adaboost等分类器对待检测目标进行特征分类从而获得图像中的行人信息。此类方法能够较快的捕获图像中待检测目标的局部特征进而获取其外观和形状的特征描述,其优点在于计算量较低、计算较为简单且具有较好的检测准确率,但该方法对于全天候场景尤其是夜间场景下的行人检测效果不佳并且准确率远不能满足现实要求。全天候场景尤其是夜间场景受光照变化的影响非常严重,行人的部分身本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多层特征融合的多光谱行人检测方法,其特征在于:包括以下步骤:S1:对数据集进行预处理,划分为训练集和测试集,并扩充训练图像;S2:采用卷积神经网络构建多层特征融合的特征提取模型,采用通道注意力机制对可见光与红外特征进行多层特征融合,根据多层融合特征构建特征金字塔;S3:引用自适应融合机制对待检测特征层的特征图尺度进行调整,通过多尺度检测获得行人边界框;S4:通过非极大值抑制算法进行筛选,去除置信度较低的边界框并输出最终的检测结果。2.根据权利要求1所述的基于多层特征融合的多光谱行人检测方法,其特征在于:步骤S1具体包括以下步骤:S11:将数据集分类为训练集和测试集,并划分为全天候场景、白天场景和夜间场景三个部分;S12:对训练图像进行随机比例的缩放,若图像尺寸小于预设尺寸则使用灰度像素点进行填充,若其尺寸大于预设尺寸则对边缘进行裁剪,同时对边界框标签进行位置修正;S13:对训练图像进行随机的水平翻转,同时修正边界框坐标,扩充训练图像;S14:将可见光图像从RGB颜色空间转换至HSV或SHL颜色空间后对图像的亮度分量进行随机调整,然后将三个分量结合并转换回RGB颜色空间;S15:根据标签信息计算获得中心点坐标(x,y),使用二维高斯函数G(
·
)依据边界框宽和高的标准差{σ
w

h
}生成中心点掩膜M其中,M
(i,j)
表示中心点掩膜,(i,j)表示像素点坐标,(x,y)表示目标中心点坐标,x
k
和y
k
分别表示第k个目标序列的中心点坐标,σ
w
和σ
h
分别表示目标边界框宽和高的标准差。3.根据权利要求1所述的基于多层特征融合的多光谱行人检测方法,其特征在于:所述步骤S2具体包括以下步骤:S21:使用模型的主干网络对预处理后的可见光图像与红外图像进行特征提取,分别获得三层具有不同分辨率的特征图{x
v1
,x
v2
,x
v3
}和{x
i1
,x
i2
,x
i3
};S22:采用通道注意力机制对特征提取获得的可见光图像特征图{x
v1
,x
v2
,x
v3
}与红外图像特征图{x
i1
,x
i2
,x
i3
}进行同尺度间的特征融合从而获得三层融合特征图{x
vi1
,x
vi2
,x
vi3
};S23:根据融合特征图{x
vi1
,x
vi2
,x
vi3
}构建特征金字塔网络,特征金字塔网络输出三层特征图{y
vi1
,y
vi2
,y
vi3
}。4.根据权利要求3所述的基于多层特征融合的多光谱行人检测方法,其特征在于:在所述步骤S22中,特征表示如下:
其中,F'表示注意力机制的输出特征,Ω
chn
表示特征通道注意力向量,F表示注意力机制的输入特征,σ表示Sigmoid函数操作,MLP(avgpool(F))表示对输入特征进行平均池化...

【专利技术属性】
技术研发人员:罗萍王涛吕霞付彭云奉
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1