【技术实现步骤摘要】
无人车辆智能跟踪控制方法、系统、设备和介质
[0001]本专利技术属于无人驾驶
,涉及一种无人车辆智能跟踪控制方法、系统、设备和介质。
技术介绍
[0002]关于车辆跟踪的研究已经持续了半个多世纪,如何使车辆跟踪方法计算效率高与驾驶的关键指标Safety
‑
Speed
‑
Smoothness等表现良好,关键在于跟踪控制方法。跟踪控制方法大体可以分为两种:理论驱动方法和数据驱动方法。理论驱动方法通常基于对实际跟车行为的观察,对后车驾驶员的反应提出各种假设,并建立数学关系来表达驾驶员的跟车策略。由于跟踪行为的复杂性和理论驱动模型的表达能力限制,理论驱动方法的跟车方法,准确性和泛化能力不强。
[0003]因此,近年来,大量研究使用了数据驱动的方法来建立车辆跟踪模型。数据驱动的方法可以直接使用数据来学习驾驶员的控制策略,并且对驾驶行为的假设更少,诸如神经网络之类的数据驱动模型具有更强的表达能力并且可以轻松地进行更新。然而,在实现本专利技术的过程中,专利技术人发现传统数据驱动的方法仍存 ...
【技术保护点】
【技术特征摘要】
1.一种无人车辆智能跟踪控制方法,其特征在于,包括步骤:采集专家示教跟踪的轨迹数据;将所述轨迹数据输入深度神经网络进行深度学习,得到专家示教跟踪的初始策略;根据所述初始策略,利用学徒学习法进行提升学习,得到最优策略;利用所述最优策略对无人车辆进行跟踪控制。2.根据权利要求1所述的无人车辆智能跟踪控制方法,其特征在于,采集专家示教跟踪的轨迹数据的步骤,包括:收集并存储专家示教跟踪的专家数据集;所述专家数据集的数据为利用搭建的车辆行驶高仿真模拟系统进行多次专家跟踪驾驶产生;从所述专家数据集中采集得到所述轨迹数据。3.根据权利要求1或2所述的无人车辆智能跟踪控制方法,其特征在于,根据所述初始策略,利用学徒学习法进行提升学习,得到最优策略的步骤,包括:将所述初始策略输入学徒学习法的算法模型;在已经迭代得到的最优策略中,通过最大边际法计算得到当前奖励函数的参数值;利用所述当前奖励函数的参数值进行强化学习,得到当前新的所述最优策略。4.根据权利要求3所述的无人车辆智能跟踪控制方法,其特征在于,所述深度神经网络包括三层深度网络;其中,第一层深度网络和第二层深度网络采用激活函数Relu,第三层深度网络采用激活函数Sigmoid,损失函数采用均方根误差、优化器采用AdadeltaOptimizer()。5.根据权利要求4所述的无人车辆智能跟踪控制...
【专利技术属性】
技术研发人员:周星,杜康,徐昕,张兴龙,方强,马清文,高浩,张荣华,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。