一种多角度车型识别方法及系统技术方案

技术编号:21399815 阅读:29 留言:0更新日期:2019-06-19 07:13
本发明专利技术公开了一种多角度车型识别方法及系统,该方法包括以下步骤:收集多角度车辆图片,构建多角度车辆数据库,进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。

【技术实现步骤摘要】
一种多角度车型识别方法及系统
本专利技术涉及模式识别与图像处理
,具体的说,是一种多角度车型识别方法及系统。
技术介绍
多角度车型识别是智能交通系统的重要组成部分之一,具有更加广泛的应用,包括智能停车系统、车辆流量的统计和车辆的检测。随着交通监控摄像机的大量使用,车型识别在计算机视觉领域得到了极大的关注,在大型卷积神经网络提取高维度特征过程中,多角度计算复杂度较高且准确率相对较低。
技术实现思路
有鉴于此,本专利技术解决上述技术问题的技术方案如下:一种多角度车型识别方法及系统。本专利技术为了解决现存问题,提供以下技术方案:一种多角度车型识别方法,包括以下步骤:收集多角度车辆图片,构建多角度车辆数据库,进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。进一步,所述进行预处理获取多角度车辆训练图片,具体包括以下步骤:将所述多角度车辆图片剪裁成统一大小,以及对所述剪裁成统一大小的多角度车辆图片进行旋转和镜像,得到数据增强后的样本图片;将所述数据增强后的样本图片进行灰度化处理,得到多角度车辆训练图片。进一步,所述构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积,具体包括以下步骤:构建卷积神经网络,所述卷积神经网络包括数据输入层、Resnet18网络卷积层、特征层、全连接特征提取层、Drop_out层、全连接分类层和分类损失层;在所述卷积神经网络中增加注意力机制结构,依次连接Conv1层、Conv2层、全局平均池化层、Fc1层、ReLU层、Fc2层、Sigmoid层,以及与所述Conv2层相连接的Scale层;在所述卷积神经网络中,将传统卷积核为3*3的卷积层替换成卷积核为3*3的深度卷积层和卷积核为1*1的逐点卷积层,所述深度卷积和逐点卷积合称为深度可分离卷积,在1*1逐点卷积运算后,不使用ReLU激活函数。进一步,所述注意力机制具体包括:特征压缩阶段:使用所述全局平均池化层,将所述卷积层的每个通道的二维特征变成一个实数,对所述二维特征进行压缩;特征激励阶段:使用一个全连接层,将输入的所述二维特征的通道数降低,减少通道的个数,降低计算量;连接ReLU激活函数,保持输出维度不变,得到非线性特征;再通过一个全连接层变回原来的维度,经过Sigmoid函数将特征权重归一化到0-1之间;特征重标定阶段:使用所述缩放层对每个所述二维特征的通道的权重进行重新标定,将所述二维特征激励操作后输出的权重加权到每个所述通道的二维特征上,以此完成对原始二维特征的重新标定。进一步,所述深度可分离卷积用于计算复杂度,所述深度可分离卷积计算复杂度具体包括:深度可分离卷积首先是一组二维的卷积核,其中卷积核的通道数为1,每次只处理一个输入通道,其中二维卷积核的数量与输入通道数一样。逐个卷积处理之后,使用三维1×1的卷积核来处理之前输出的特征图,最终输出的通道数变成了一个指定的数量。一组与通道数相同的二维卷积核的计算量为:Dk×Dk×M×Df×Df三维1×1卷积核的计算量为:N×M×Df×Df所以使用深度可分离卷积总的计算量为:Dk×Dk×M×Df×Df+N×M×Df×Df因此使用深度可分离卷积与传统卷积的计算量之比为:一种实现上述方法的系统,其特征在于,包括包括数据库构建模块、网络构建模块、模型获取模块、车型判定模块;所述数据库构建模块还包括图像处理单元;所述数据库构建模块用于收集多角度车辆图片,构建多角度车辆数据库,所述图像处理单元用于将图片进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;所述网络构建模块用于构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;所述模型获取模块用于对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;所述车型判定模块用于通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。进一步,所述图像处理单元还用于将所述多角度车辆图片剪裁成统一大小,以及对所述剪裁成统一大小的多角度车辆图片进行旋转和镜像,得到数据增强后的样本图片;所述图像处理单元还用于将所述样本图片进行灰度化处理,得到多角度车辆训练图片。进一步,所述网络构建模块还用于构建卷积神经网络,包括数据输入层、Resnet18网络卷积层、特征层、全连接特征提取层、Drop_out层、全连接分类层和分类损失层;所述网络构建模块还用于在所述卷积神经网络中增加注意力机制结构,依次连接Conv1层、Conv2层、全局平均池化层、Fc1层、ReLU层、Fc2层、Sigmoid层,还包括与所述Conv2层相连接的Scale层;所述网络构建模块还用于在所述卷积神经网络中,将传统卷积核为3*3的卷积层替换成卷积核为3*3的深度卷积层和卷积核为1*1的逐点卷积层,所述深度卷积和逐点卷积合称为深度可分离卷积,在1*1逐点卷积运算后,不使用ReLU激活函数。进一步,所述注意力机制具体包括:特征压缩阶段:使用所述全局平均池化层,将所述卷积层的每个通道的二维特征变成一个实数,对所述二维特征进行压缩;特征激励阶段:使用一个全连接层,将输入的所述二维特征的通道数降低,减少通道的个数,降低计算量;连接ReLU激活函数,保持输出维度不变,得到非线性特征;再通过一个全连接层变回原来的维度,经过Sigmoid函数将特征权重归一化到0-1之间;特征重标定阶段:使用所述缩放层对每个所述二维特征的通道的权重进行重新标定,将所述二维特征激励操作后输出的权重加权到每个所述通道的二维特征上,以此完成对原始二维特征的重新标定。进一步,所述深度可分离卷积用于计算复杂度,所述深度可分离卷积计算复杂度具体包括:深度可分离卷积首先是一组二维的卷积核,其中卷积核的通道数为1,每次只处理一个输入通道,其中二维卷积核的数量与输入通道数一样。逐个卷积处理之后,使用三维1×1的卷积核来处理之前输出的特征图,最终输出的通道数变成了一个指定的数量。一组与通道数相同的二维卷积核的计算量为:Dk×Dk×M×Df×Df三维1×1卷积核的计算量为:N×M×Df×Df所以使用深度可分离卷积总的计算量为:Dk×Dk×M×Df×Df+N×M×Df×Df因此使用深度可分离卷积与传统卷积的计算量之比为:本专利技术的有益效果是:采用一种基于深度可分离卷积神经网络,用以减少卷积神经网络的参数和压缩生成模型的尺寸,同时使用一种注意力机制网络结构,能够让网络模型对特征权重进行重新标定,使得网络在训练的过程中能够加强有价值的特征通道抑制无用的特征通道。其准确率和识别效率相较于传统方法都有较大的提升。本专利技术附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术实践了解到。附图说明图1为本专利技术实施例提供的一种多角度车型识别方法的流程示意图;图2为本专利技术实施例提供的一种多角度车型识别方法的结构示意图;图3本专利技术深度可分离卷积网络结构;图4本专利技术集中注意力机制网络结构。具本文档来自技高网...

【技术保护点】
1.一种多角度车型识别方法,其特征在于,所述方法包括以下步骤:收集多角度车辆图片,构建多角度车辆数据库,进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。

【技术特征摘要】
1.一种多角度车型识别方法,其特征在于,所述方法包括以下步骤:收集多角度车辆图片,构建多角度车辆数据库,进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。2.根据权利要求1所述的方法,其特征在于,所述进行预处理获取多角度车辆训练图片,具体包括以下步骤:将所述多角度车辆图片剪裁成统一大小,以及对所述剪裁成统一大小的多角度车辆图片进行旋转和镜像,得到数据增强后的样本图片;将所述数据增强后的样本图片进行灰度化处理,得到多角度车辆训练图片。3.根据权利要求1所述的方法,其特征在于,所述构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积,具体包括以下步骤:构建卷积神经网络,所述卷积神经网络包括数据输入层、Resnet18网络卷积层、特征层、全连接特征提取层、Drop_out层、全连接分类层和分类损失层;在所述卷积神经网络中增加注意力机制结构,依次连接Conv1层、Conv2层、全局平均池化层、Fc1层、ReLU层、Fc2层、Sigmoid层,以及与所述Conv2层相连接的Scale层;在所述卷积神经网络中,将传统卷积核为3*3的卷积层替换成卷积核为3*3的深度卷积层和卷积核为1*1的逐点卷积层,所述深度卷积和逐点卷积合称为深度可分离卷积,在1*1逐点卷积运算后,不使用ReLU激活函数。4.根据权利要求1或3所述的方法,其特征在于,所述注意力机制具体包括:特征压缩阶段:使用所述全局平均池化层,将所述卷积层的每个通道的二维特征变成一个实数,对所述二维特征进行压缩;特征激励阶段:使用一个全连接层,将输入的所述二维特征的通道数降低,减少通道的个数,降低计算量;连接ReLU激活函数,保持输出维度不变,得到非线性特征;再通过一个全连接层变回原来的维度,经过Sigmoid函数将特征权重归一化到0-1之间;特征重标定阶段:使用所述缩放层对每个所述二维特征的通道的权重进行重新标定,将所述二维特征激励操作后输出的权重加权到每个所述通道的二维特征上,以此完成对原始二维特征的重新标定。5.根据权利要求1或3所述的方法,其特征在于,所述深度可分离卷积用于计算复杂度,所述深度可分离卷积计算复杂度具体包括:深度可分离卷积首先是一组二维的卷积核,其中卷积核的通道数为1,每次只处理一个输入通道,其中二维卷积核的数量与输入通道数一样。逐个卷积处理之后,使用三维1×1的卷积核来处理之前输出的特征图,最终输出的通道数变成了一个指定的数量。一组与通道数相同的二维卷积核的计算量为:Dk×Dk×M×Df×Df三维1×1卷积核的计算量为:N×M×Df×Df所以使用深度可分离卷积总的计算量为:Dk×Dk×M×Df×Df+N×M×Df×Df因此使用深度可分离卷积与传统卷积的计算量之比为:6.一种多角度车型识别系统,其特征在于,包括数据库构建模块、网络...

【专利技术属性】
技术研发人员:蔡晓东万今朝
申请(专利权)人:桂林远望智能通信科技有限公司
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1