【技术实现步骤摘要】
本公开涉及一种用于控制车辆编队的装置,该装置执行强化学习,使得车辆编队能够稳定且有效地执行,本公开还涉及一种用于控制车辆编队的方法。
技术介绍
1、通常,车辆编队意味着多台车辆编组在一起,彼此共享驾驶信息,并在考虑外部环境的同时在道路上行驶。
2、为了稳定地执行车辆编队,适当地保持编队车辆之间的距离并控制后方车辆跟随前方车辆的行驶轨迹是重要的。
3、自动驾驶系统可以执行用于车辆编队的强化学习,使得自动驾驶车辆在队列行驶期间采取最佳行动。
4、强化学习是一种机器学习方法,通过反复试错来学习在当前状态下采取哪种行动最佳。无论何时采取行动,都会给予奖励,学习朝着最大化奖励的方向进行。
5、上述内容仅旨在帮助理解本公开的背景,并不意味着本公开落入本领域技术人员已知的相关技术的范围内。
技术实现思路
1、因此,本公开是考虑到相关技术中出现的上述问题而作出的,并且本公开旨在提出一种用于控制车辆编队的装置,该装置通过在队列行驶期间使用视频信息和主车辆的行驶
...【技术保护点】
1.一种用于控制车辆编队的装置,所述装置包括:
2.根据权利要求1所述的装置,其中,所述控制点对应于控制样条曲线的形状的点,所述样条曲线对应于所述主车辆的所述行驶轨迹。
3.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述坐标在行驶车道之外时,所述奖励确定部输出负反馈作为所述反馈信号。
4.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标在所述控制点的所述坐标的预设风险距离之外时,所述奖励确定部输出负反馈作为所述反馈信号。
5.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标
...【技术特征摘要】
1.一种用于控制车辆编队的装置,所述装置包括:
2.根据权利要求1所述的装置,其中,所述控制点对应于控制样条曲线的形状的点,所述样条曲线对应于所述主车辆的所述行驶轨迹。
3.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述坐标在行驶车道之外时,所述奖励确定部输出负反馈作为所述反馈信号。
4.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标在所述控制点的所述坐标的预设风险距离之外时,所述奖励确定部输出负反馈作为所述反馈信号。
5.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。