一种基于改进faster R-CNN的物流车辆特征定位的方法技术

技术编号:26480029 阅读:60 留言:0更新日期:2020-11-25 19:25
一种基于改进faster R‑CNN的物流车辆特征定位的方法,包括:步骤一,物流车辆图像增强处理;引入数据增强的手段对物流车辆图像进行处理;步骤二,构建基础网络模型;采用VGGNet‑16基本网络作为特征提取网络;同时为了实现对物流车辆的定位,在VGGNet‑16的第五个卷积层第三个卷积分层中的特征提取模块后加入了一个RPN网络的目标检测定位模型;步骤三,使用非极大值抑制算法对物流车辆目标的筛选;步骤四,对物流车辆目标特征进行统一归一化;将得到的固定维度数据的特征图传入到基本网络模型的第七阶段即可求得精确的物流车辆定位边界框及其对应车型的概率。本发明专利技术在不同环境、场景下对物流车辆的特征定位性能良好。

【技术实现步骤摘要】
一种基于改进fasterR-CNN的物流车辆特征定位的方法
本专利技术涉及一种基于改进fasterR-CNN的物流车辆特征定位的方法。技术背景近年来随着交通物流的发展,越来越多的物流车辆服务于我们的工作和生活中,但这也造成了一个问题,过多的物流工程车辆,导致园区内车辆停放管理难度系数加大。虽然物流车辆的拖挂、甩挂等操作能够提高货物装载的运行效率,但是目前尚存在物流车辆不合理占用停车位、拖挂、甩挂无法精准收费等问题,更为严重的是有些车主为了躲避监控的检测存在套牌等极度危险的行为。为了有效解决物流工程车辆方面的管理问题,现如今已有很多通过采用计算机视觉等技术手段对不同车型的物流车辆进行识别的例子,其识别方法大多是从交通路口摄像头或者图像采集卡中获得车型的图像,又因为交通视频所采集到的画面是车辆在自然环境下经过某一位置的定位,即找出图像中车辆的准确位置后对其进行车辆的特征提取操作,从而达到车型的识别。但是目前的识别方法对车型识别主要存在以下几方面的困难:(1)不同光照条件下对车型的识别效果影响极大,同一辆车在晴天、雨天、雪天等环境下的视觉本文档来自技高网...

【技术保护点】
1.一种基于改进faster R-CNN的物流车辆特征定位的方法,包括如下步骤:/n步骤一,物流车辆图像增强处理;/n引入数据增强的手段,通过按照多尺度等比例缩放、图像旋转和增强饱和度等操作对物流车辆图像进行处理,从而增加其场景多样性,以便用于进一步的识别定位;/n1.1)对物流车辆进行多尺度等比例缩放操作;/n本着不破坏原始图像中物流车辆特定长宽高比例的原则,对物流车辆图像进行多种尺度的缩放,使得定位网络能够学习到特定比例的目标特征;/n假设某物流车辆缩放前的像素坐标记为A

【技术特征摘要】
1.一种基于改进fasterR-CNN的物流车辆特征定位的方法,包括如下步骤:
步骤一,物流车辆图像增强处理;
引入数据增强的手段,通过按照多尺度等比例缩放、图像旋转和增强饱和度等操作对物流车辆图像进行处理,从而增加其场景多样性,以便用于进一步的识别定位;
1.1)对物流车辆进行多尺度等比例缩放操作;
本着不破坏原始图像中物流车辆特定长宽高比例的原则,对物流车辆图像进行多种尺度的缩放,使得定位网络能够学习到特定比例的目标特征;
假设某物流车辆缩放前的像素坐标记为A0(x0,y0),缩放后的坐标记为A1(x1,y1),则A0与A1满足关系式:
(x1,y1)=(μx0,μy0)(1)
其中,μ表示缩放因子;上式对应于图像缩放矩阵中,表示为如下矩阵:



其中,当μ>1时,表示图像放大操作;当μ<1时,表示图像缩小操作;为了减少模型运行的成本;
1.2)对物流车辆图像进行旋转操作;
由于摄像头拍摄快速行驶中的物流车辆时,会导致抓拍到的图像角度差异极大的现象,为了适应不同角度的识别定位,须将抓取获得的物流车辆图像进行旋转变换,从而产生多种角度的车辆特征信息;
设定物流车辆图像的中心作为旋转中心O(0,0),其逆时针旋转角度记为θ,当图像中的任意一像素点P(x,y)经过旋转变换后变为P1(x1,y1),则通过下式来表示旋转过程:



上式为极坐标变换公式,对应于图像旋转矩阵中,表示为如下矩阵:



1.3)对物流车辆图像进行饱和度增强操作;
为了增加数据样本的多样性,使得特征定位网络能够适用于复杂光照环境,对物流车辆图像的饱和度进行调整;
调整图像饱和度的具体流程如下:
(S1)计算物流车辆图像上的像素点极值;



其中,rgbMax表示像素最大值,rgbMin表示像素最小值;
(S2)饱和度计算;
饱和度S计算公式如下:
delta=(rgbMax-rgbMin)/255(6)
value=(rgbMax+rgbMin)/255(7)
L=value/2(8)



(S3)调整物流车辆图像饱和度;
设定一个饱和度参数β用以调整光照强度,其计算流程如下所示:
1.若参数β≥0,则先求出中间变量的值:



更新的值:



调整饱和度:
RGB'=RGB+(RGB-L*255)*α(12)
2.若参数β<0,则:
RGB'=L*255+(RGB-L*255)*(1+α)(13)
将经过缩放处理、旋转操作及饱和度增强的物流车辆图像应用到如下步骤,以便对物流车辆特征进行精确的定位;
步骤二,构建基础网络模型;
采用VGGNet-16基本网络作为特征提取网络,用于对不同车型的物流车辆进行分类;同时为了实现对物流车辆的定位,在VGGNet-16的第五个卷积层第三个卷积分层中的特征提取模块后加入了一个RPN网络的目标检测定位模型;
构建基础网络模型的步骤如下:
(T1)第一阶段:首先输入经过步骤一处理的W*H*3大小的图像;然后经过两个连续的64通道的卷积层对物流车辆图像进行卷积操作,其卷积核大小为3*3、卷积步长为2;随后,经过一个64通道的最大池化层对卷积后的图像进行降维,其池化核大小为2*2,步长为2;此阶段输出一张大小的特征图;
(T2)第二阶段:流程与第一阶段相同,即将第一阶段得到的图像输入至第二阶段网络中,然后经过卷积、池化操作得到新的特征图;但与第一阶段不同的是第二阶段的卷积和池化通道均变为128,其他参数均与第一阶段相同;
(T3)第三阶段:首先将第二阶段输出的图像输入至第三阶段的网络中;然后经过三个连续的256通道的卷积层对该图像进行卷积操作,其卷积核大小为3*3、卷积步长为2;随后,经过一个256通道的最大池化层对卷积后的图像进行降维,其池化核大小为2*2,步长为2;
(T4)第四阶段:流程与第三阶段相同,即将第三阶段得到的图像输入至第四阶段网络中,然后经过卷积、池化操作得到新的特征图;但与第三阶段不同的是第四阶段的卷积和池化通道均变为512,其他参数均与第三阶段相同;
(T5)第五阶段:该阶段由三个卷积层组成,每个卷积层有512个通道,其卷积核大小为3*3、卷积步长为2;在此阶段输出的特征图大小为
(T6)第六阶段:首先连接一个卷积核大小为3*3、卷积步长为2、卷积...

【专利技术属性】
技术研发人员:张烨樊一超陈威慧
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1