用于控制车辆编队的装置和方法制造方法及图纸

技术编号:41288335 阅读:25 留言:0更新日期:2024-05-11 09:37
提出了一种用于车辆编队的装置和控制方法,所述装置包括:学习设备,所述学习设备基于反馈信号和视频信息来执行强化学习,并且基于所述强化学习的结果控制主车辆的行驶,使得后方车辆能够跟随主车辆的行驶轨迹;以及奖励确定部,所述奖励确定部通过将后方车辆的坐标与主车辆的行驶轨迹的控制点的坐标进行比较来产生反馈信号。

【技术实现步骤摘要】

本公开涉及一种用于控制车辆编队的装置,该装置执行强化学习,使得车辆编队能够稳定且有效地执行,本公开还涉及一种用于控制车辆编队的方法。


技术介绍

1、通常,车辆编队意味着多台车辆编组在一起,彼此共享驾驶信息,并在考虑外部环境的同时在道路上行驶。

2、为了稳定地执行车辆编队,适当地保持编队车辆之间的距离并控制后方车辆跟随前方车辆的行驶轨迹是重要的。

3、自动驾驶系统可以执行用于车辆编队的强化学习,使得自动驾驶车辆在队列行驶期间采取最佳行动。

4、强化学习是一种机器学习方法,通过反复试错来学习在当前状态下采取哪种行动最佳。无论何时采取行动,都会给予奖励,学习朝着最大化奖励的方向进行。

5、上述内容仅旨在帮助理解本公开的背景,并不意味着本公开落入本领域技术人员已知的相关技术的范围内。


技术实现思路

1、因此,本公开是考虑到相关技术中出现的上述问题而作出的,并且本公开旨在提出一种用于控制车辆编队的装置,该装置通过在队列行驶期间使用视频信息和主车辆的行驶轨迹的控制点来执行强本文档来自技高网...

【技术保护点】

1.一种用于控制车辆编队的装置,所述装置包括:

2.根据权利要求1所述的装置,其中,所述控制点对应于控制样条曲线的形状的点,所述样条曲线对应于所述主车辆的所述行驶轨迹。

3.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述坐标在行驶车道之外时,所述奖励确定部输出负反馈作为所述反馈信号。

4.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标在所述控制点的所述坐标的预设风险距离之外时,所述奖励确定部输出负反馈作为所述反馈信号。

5.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所...

【技术特征摘要】

1.一种用于控制车辆编队的装置,所述装置包括:

2.根据权利要求1所述的装置,其中,所述控制点对应于控制样条曲线的形状的点,所述样条曲线对应于所述主车辆的所述行驶轨迹。

3.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述坐标在行驶车道之外时,所述奖励确定部输出负反馈作为所述反馈信号。

4.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标在所述控制点的所述坐标的预设风险距离之外时,所述奖励确定部输出负反馈作为所述反馈信号。

5.根据权利要求1所述的装置,其中,当所述后方车辆的所述坐标相比于所述控制点的所述...

【专利技术属性】
技术研发人员:赵兴来
申请(专利权)人:现代摩比斯株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1