一种基于深度学习与强化学习的车辆识别方法技术

技术编号：14339487 阅读：65 留言：0更新日期：2017-01-04 12:05

本发明专利技术公开了一种基于深度学习与强化学习的车辆识别方法，在利用深度网络的结构特点上，提供一种深度学习与强化学习结合的方法，将强化学习中的Q‑学习算法应用到深度学习网络中，训练过程仍然使用随机梯度下降算法，提高了深度网络对车辆的识别的能力；其次，加入了基于错分样本学习的强化学习技术，克服了深度学习网络在车辆识别领域现有的技术不足，提升车辆识别性能的同时，也提高了网络的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别
，更为具体地讲，涉及一种基于深度学习与强化学习的车辆识别方法。
技术介绍
车辆识别是智能交通领域的一个重要课题，设计一个可靠的车辆识别系统主要难点在于车辆间的差异性。深度学习网络由于模拟人的大脑，相比传统的方法对车辆部分遮挡有更强的识别鲁棒性。在现有技术中，常用的方法是通过深层结构来提取抽象特征，再通过抽象特征对车辆进行识别。然而在深度学习网络的训练过程中，常常有如下的问题：与训练传统的三层神经网络相比，深度学习网络由于计算量大以及需要更新的参数更多，导致时间成本增加。其次，深度学习网络在输出误差变化不大时，训练过程会变慢，需要时间过长。本专利技术针对上述问题，引入强化学习的相关技术，克服这些缺点，实现更快速、更高准确率的车辆识别。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种基于深度学习与强化学习的车辆识别方法，通过加入基于错分样本学习的强化学习技术，提升车辆识别的性能，同时也加快了网络的训练速度为实现上述专利技术目的，本专利技术一种基于深度学习与强化学习的车辆识别方法，其特征在于，包括以下步骤：(1)、图像预处理从车辆样本库中提取车辆图像样本，再将提取的车辆图像样本转换为灰度图，并归一化，再对归一化后的每一幅车辆图像样本添加数值标签，即：不含车辆的图像添加数值“0”、含小汽车的图像添加数值“1”、含卡车的图像添加数值“2”、含大巴车的图像添加数值“3”；(2)、计算第t个车辆图像样本的期望最大回报值(2.1)、将第t个车辆图像样本按照原始像素值组成的行向量xt，对应的数值标签表述为at，at∈[0,3]；(...
一种基于深度学习与强化学习的车辆识别方法

【技术保护点】
一种基于深度学习与强化学习的车辆识别方法，其特征在于，包括以下步骤：(1)、图像预处理从车辆样本库中提取车辆图像样本，再将提取的车辆图像样本转换为灰度图，并归一化，再对归一化后的每一幅车辆图像样本添加数值标签，即：不含车辆的图像添加数值“0”、含小汽车的图像添加数值“1”、含卡车的图像添加数值“2”、含大巴车的图像添加数值“3”；(2)、计算第t个车辆图像样本的期望最大回报值(2.1)、将第t个车辆图像样本按照原始像素值组成的行向量xt，对应的数值标签表述为at，at∈[0,3]；(2.2)、按照Q‑学习理论，计算出第t个车辆图像样本的未来回报rt为：rt=Σt′=tTγt′-trt′]]>其中，T是车辆图像样本的总量，γt′‑t表示第t个样本对t′个样本的奖励折扣系数；(2.3)、利用最优动作‑值函数Q*(x,a)计算出第t个车辆图像样本的期望最大回报值；Qt*(xt,at)＝maxπE[rt|xt＝x,at＝a,π]其中，x泛指车辆图像样本，a泛指数值标签，π是车辆图像样本和数值标签的映射函数，通过选择不同的数值标签at∈...

【技术特征摘要】
1.一种基于深度学习与强化学习的车辆识别方法，其特征在于，包括以下步骤：(1)、图像预处理从车辆样本库中提取车辆图像样本，再将提取的车辆图像样本转换为灰度图，并归一化，再对归一化后的每一幅车辆图像样本添加数值标签，即：不含车辆的图像添加数值“0”、含小汽车的图像添加数值“1”、含卡车的图像添加数值“2”、含大巴车的图像添加数值“3”；(2)、计算第t个车辆图像样本的期望最大回报值(2.1)、将第t个车辆图像样本按照原始像素值组成的行向量xt，对应的数值标签表述为at，at∈[0,3]；(2.2)、按照Q-学习理论，计算出第t个车辆图像样本的未来回报rt为：rt=Σt′=tTγt′-trt′]]>其中，T是车辆图像样本的总量，γt′-t表示第t个样本对t′个样本的奖励折扣系数；(2.3)、利用最优动作-值函数Q*(x,a)计算出第t个车辆图像样本的期望最大回报值；Qt*(xt,at)＝maxπE[rt|xt＝x,at＝a,π]其中，x泛指车辆图像样本，a泛指数值标签，π是车辆图像样本和数值标签的映射函数，通过选择不同的数值标签at∈a来计算奖励的期，期望值最大时对应的数值标签即为该车辆图像样本的数值标签；(3)、构建深度学习网络的权值更新方程(3.1)、计算第t个车辆图像样本的目标输出yyt=E[rt+γmaxat-1Qt-1*(xt-1,at-1;θt-1)|x,a]]]>其中，θt-1表示第t-1个图像样本时的权值参数，γ为折扣系数；(3.2)、通过最小化损失函数Lt(θt)来更新深度学习网络的权值参数Lt(θt)=Ext,at~ρ(·)[(yt-Qt*(xt,at;θt))2]]]>其中，ρ(x,a)是图像样本x和标签a的概率分布，E[·]为求期望；(3.3)、损失函...

【专利技术属性】
技术研发人员：孟继成，丁乐乐，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人