一种基于卷积神经网络的细粒度车辆多属性识别方法技术

技术编号:17655628 阅读:83 留言:0更新日期:2018-04-08 08:45
本发明专利技术涉及一种基于卷积神经网络的细粒度车辆多属性识别方法,属于计算机视觉识别技术领域。该方法包括以下步骤:设计神经网络结构,包括卷积层、池化层和全连接层,其中卷积层与池化层负责特征提取,在最后一层全连接层通过计算目标损失函数输出分类结果;利用细粒度车辆数据集和标签数据集进行神经网络的训练,训练方式为有监督学习,并利用随机梯度下降算法进行权重矩阵和偏移量的调整;训练好的神经网络模型,用于进行车辆属性识别。本发明专利技术可应用到车辆的多属性识别,利用细粒度车辆数据集和多属性标签数据集通过卷积神经网络获得车辆更抽象的高层表达,从大量训练样本中学习到反映待识别车辆本质的隐形特征,可扩展性更强,识别精度也更高。

【技术实现步骤摘要】
一种基于卷积神经网络的细粒度车辆多属性识别方法
本专利技术属于计算机视觉识别
,涉及一种基于卷积神经网络的细粒度车辆多属性识别方法。
技术介绍
随之经济发展,汽车已成为人们最主要的交通工具,伴随而来的城市交通拥堵问题更是日益严重,出现越来越多的“堵城”。智能交通系统被认为是目前缓解交通压力最佳方案,而且智能交通系统作为智慧城市、数字城市的一部分,主要应用于交通流量监控、车辆监控、高速公路收费站管理、小区智能管理、停车场管理、交警执法、公安刑侦调查等,其中车辆检测识别是智能交通系统最为关键的部分,是实现交通管理智能化的重要环节,是计算机视觉和模式识别即使在智能交通系统中的重要研究课题。车辆识别技术在车辆全自动不停车收费,交通流量控制指标测量,车辆自动识别,高速公路上事故自动测报,不停车检查,车辆定位,汽车防盗,稽查和追踪车辆违规、违法行为,维护交通安全和城市治安,防止交通堵塞,提高收费路桥的服务速度,缓解交通紧张状况等方面都具有积极作用。近年来,由于强大的特征表达能力,深度学习已经引起广泛的关注,解决了传统的线性分类器特征提取的瓶颈。卷积神经网络已经被应用于车辆分类识别任务中来。然而,这些工作对于原始卷积神经网络架构都是非常初步的,并且很多重要的实际问题并没有被讨论,尤其是涉及车辆多属性识别问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于卷积神经网络的细粒度车辆多属性识别方法。该方法基于卷积神经网络结构,采用多任务同时学习机制,引入空间度量学习,提取车辆图像高层抽象表达。通过得到图像tripletloss和softmaxloss,进而联合学习两种损失来训练网络。为达到上述目的,本专利技术提供如下技术方案:一种基于卷积神经网络的细粒度车辆多属性识别方法,该方法包括以下步骤:S1:构建多任务学习的神经网络层级结构;S2:利用包含不同车辆属性的细粒度图像分类的车辆数据集,训练神经网络,学习TripletLoss和SoftmaxLoss的联合损失从而进行权重参数矩阵和偏置值的调整;S3:将得到的训练好的各层中的权重参数矩阵和偏置值,对应地赋值给神经网络中的各个层,用于车辆特征提取和车辆多属性识别。进一步,所述神经网络层级结构包括输入层、卷积层、激活函数层、归一化层、池化层、全连接层、切片层和分类输出层,其中,输入层包括原始图像输入层和标签数据输入层;卷积层、激活函数层、归一化层、池化层和全连接层负责车辆特征提取;切片层负责标签数据切片;分类层负责输出分类结果。进一步,所述步骤2具体为:利用切片层对标签数据进行切分,标签数据与图像特征数据进行分类学习,通过学习不同属性的联合损失完成不同的属性任务;各个学习任务共享隐层,即发掘不同属性学习的内在联系,又区别学习任务之间的差别;针对车辆的不同属性,确定不同的学习任务,每一个学习任务学习车辆的一种属性,并对车辆属性进行识别;对车辆的每一个属性进行标签标记,得到多属性标签数据;所述多任务学习为一次学习多个任务,多个任务并行学习,结果相互影响;所述车辆属性包括车辆品牌、车型、颜色的车辆附加属性;所述训练神经网络的训练方式为带标签的数据的有监督学习;所述TripletLoss是三元组网络结构TripletNetwork的输出损失,所述SoftmaxLoss是Softmax回归函数的输出损失;其中三元组网络结构属于度量学习,是通过训练和学习,减小同类样本之间的距离,同时增大不同类别样本之间的距离;所述细粒度图像分类是相对于粗粒度分类而言,用于识别相似类别下不同子类之间的细微差异。进一步,所述神经网络层级结构包括2个输入层,5个卷积层,5个激活函数层,2个归一化层,3个池化层,3个全连接层,1个切片层和若干分类输出层;其中,第一个卷积层利用96个大小为11x11x3,步长为4个像素的卷积核,对大小为224x224x3的输入图像进行卷积滤波;第二层卷积层将第一个卷积层的输出作为输入,是响应归一化以及池化后的结果,并利用256个大小为5x5x48的卷积核进行滤波;第三、第四和第五个卷积层彼此相连,没有介于任何池化层与归一化层中间;第三个卷积层有384个大小为3x3x256的卷积核连接到第二个卷积层的输出,是归一化的、池化后的结果;第四个卷积层拥有384个大小为3x3x192的核;第五个卷积层拥有256个大小为3x3x192的核;池化层采用大小为3,步长为2的池化窗口,采用重叠池化策略;激活函数层应用于每个卷积层和全连接层的输出,采用不饱和非线性函数f(x)=max(0,x)解决非线性问题;dropout层以0.5的概率将每个隐层神经元的输出设置为零,避免过拟合现象的发生;全连接层有4096个神经元,用于整个卷积神经网络中的分类。进一步,在所述神经网络层级结构中,输入层的输入包括原始图像数据和多属性标签数据,其中原始图像数据输入原始图像数据,多属性标签数据输入多属性标签数据;在最后一层全连接层将该层输入数据分裂为N个分支,其中N为需要学习的车辆属性个数;多属性标签数据输入层后有数据切片层,将标签数据切分为N个标签切片,每一个标签切片拥有一个属性标记,其中N为需要学习的车辆属性个数;将分裂后的原始图像数据与标签切片联合学习,最终输出各个属性的分类结果。进一步,所述联合损失的学习方法为:定义用于训练的数据图像个数为N,类别数为C,记图像ri的标签类别为li,记为其中i=1…N,f(ri,c)为类别c在最后一层全连接层的输出,c=1,...,C,则所有训练图像{ri}i在最后一层全连接层的Softmax损失输出定义为负对数似然之和:所述度量学习为:使用三张图像组成一个三元组,记为,其中是参考样本,是和同类别的图像,称为正样本,是和不同类别的图像,称为负样本;记图像特征表达为f(x),f(x)需要经过L2规范化,即满足||f(x)||2=1,则三元组中样本的特征表达式分别为和α为预设阈值,三元组损失TripletLoss表示为:采用SoftmaxLoss和TripletLoss两种损失的联合损失进行最终分类结果的衡量,联合损失表达为:L=ωLtriplet+(1-ω)Lsoftmax其中,参数ω表示TripletLoss所占比重。本专利技术的有益效果在于:(1)本专利技术把卷积神经网络与车辆多属性学习结合起来,具有针对性地进行设计、训练、改进,同时学习并输出车辆的多种属性;(2)本专利技术利用深度学习提取车辆特征表示,减少了人为干预。附图说明为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:图1为本专利技术实现方法示意图;图2为基于Lsoftmax和Ltriplet的联合学习网络结构模型;图3为适用于多任务学习的神经网络结构模型;图4为本专利技术的卷积神经网络的结构图。具体实施方式下面将结合附图,对本专利技术的优选实施例进行详细的描述。如图1所示,图1为本专利技术实现方法示意图。包括两个模块:训练模块和测试模块。训练模块是神经网络的训练过程,训练数据集和标签数据经过多任务神经网络得到神经模型,测试模块是神经网络测试过程,测试数据集经过特征提取过程,通过训练好的神经模型得到最终输出。如图2所示,图2为Lsoftmax和Ltriplet的联合学习网络结构模型,步骤如下:步骤201本文档来自技高网...
一种基于卷积神经网络的细粒度车辆多属性识别方法

【技术保护点】
一种基于卷积神经网络的细粒度车辆多属性识别方法,其特征在于:该方法包括以下步骤:S1:构建多任务学习的神经网络层级结构;S2:利用包含不同车辆属性的细粒度图像分类的车辆数据集,训练神经网络,学习Triplet Loss和Softmax Loss的联合损失从而进行权重参数矩阵和偏置值的调整;S3:将得到的训练好的各层中的权重参数矩阵和偏置值,对应地赋值给神经网络中的各个层,用于车辆特征提取和车辆多属性识别。

【技术特征摘要】
1.一种基于卷积神经网络的细粒度车辆多属性识别方法,其特征在于:该方法包括以下步骤:S1:构建多任务学习的神经网络层级结构;S2:利用包含不同车辆属性的细粒度图像分类的车辆数据集,训练神经网络,学习TripletLoss和SoftmaxLoss的联合损失从而进行权重参数矩阵和偏置值的调整;S3:将得到的训练好的各层中的权重参数矩阵和偏置值,对应地赋值给神经网络中的各个层,用于车辆特征提取和车辆多属性识别。2.根据权利要求1所述的一种基于卷积神经网络的细粒度车辆多属性识别方法,其特征在于:所述神经网络层级结构包括输入层、卷积层、激活函数层、归一化层、池化层、全连接层、切片层和分类输出层,其中,输入层包括原始图像输入层和标签数据输入层;卷积层、激活函数层、归一化层、池化层和全连接层负责车辆特征提取;切片层负责标签数据切片;分类层负责输出分类结果。3.根据权利要求1所述的一种基于卷积神经网络的细粒度车辆多属性识别方法,其特征在于:所述步骤2具体为:利用切片层对标签数据进行切分,标签数据与图像特征数据进行分类学习,通过学习不同属性的联合损失完成不同的属性任务;各个学习任务共享隐层,即发掘不同属性学习的内在联系,又区别学习任务之间的差别;针对车辆的不同属性,确定不同的学习任务,每一个学习任务学习车辆的一种属性,并对车辆属性进行识别;对车辆的每一个属性进行标签标记,得到多属性标签数据;所述多任务学习为一次学习多个任务,多个任务并行学习,结果相互影响;所述车辆属性包括车辆品牌、车型、颜色的车辆附加属性;所述训练神经网络的训练方式为带标签的数据的有监督学习;所述TripletLoss是三元组网络结构TripletNetwork的输出损失,所述SoftmaxLoss是Softmax回归函数的输出损失;其中三元组网络结构属于度量学习,是通过训练和学习,减小同类样本之间的距离,同时增大不同类别样本之间的距离;所述细粒度图像分类是相对于粗粒度分类而言,用于识别相似类别下不同子类之间的细微差异。4.根据权利要求1或2所述的一种基于卷积神经网络的细粒度车辆多属性识别方法,其特征在于:所述神经网络层级结构包括2个输入层,5个卷积层,5个激活函数层,2个归一化层,3个池化层,3个全连接层,1个切片层和若干分类输出层;其中,第一个卷积层利用96个大小为11x11x3,步长为4个像素的卷积核,对大小为224x224x3的输入图像进行卷积滤波;第二层卷积层将第一个卷积层的输出作为输入,是响应归一化以及池化后的结果,并利用256个大小为5x5x48的卷积核进行滤波;第三、第四和第五个卷积层彼此相连,没有介于任何池化层与归一化层中间;第三个卷积层有384个大小为3x3x256的...

【专利技术属性】
技术研发人员:唐伦王耀玮杨恒刘云龙陈前斌
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1