【技术实现步骤摘要】
用于自动驾驶的系统和方法
本申请一般涉及用于自动驾驶的系统和方法,尤其涉及用于确定自动驾驶中的控制信号的系统和方法。
技术介绍
随着微电子技术和机器人技术的发展,自动驾驶的探索现已发展迅速。对于自动驾驶系统来说,基于与自动驾驶系统的车辆相关的驾驶信息(例如,起始位置、定义的目的地、道路状况)确定合适的控制信号(例如,加速器控制信号)是很重要的。通常,自动驾驶系统通过执行一系列操作来确定控制信号,例如,获取驾驶信息,基于驾驶信息确定驾驶动作,基于驾驶动作规划驾驶路径,基于驾驶路径确定控制信号等。然而,如果可以更直接地确定控制信号,则可以显著提高自动驾驶系统的效率。因此,希望提供用于基于与车辆相关的驾驶信息确定控制信号的系统和方法,从而提高自动驾驶系统的性能。
技术实现思路
本申请的一方面涉及一种用于确定自动驾驶中控制信号的系统。该系统包括获取模块、状态确定模块、候选控制信号确定模块、目标控制信号确定模块及传输模块。所述获取模块用于获取与车辆相关的驾驶信息;所述状态确定模块用于确定所述车辆的状态;所述候选控制 ...
【技术保护点】
1.一种用于确定自动驾驶中控制信号的系统,包括:/n获取模块,用于获取与车辆相关的驾驶信息;/n状态确定模块,用于确定所述车辆的状态;/n候选控制信号确定模块,用于基于所述驾驶信息和所述车辆的所述状态,通过使用训练的控制模型,确定一个或以上候选控制信号和对应于所述一个或以上候选控制信号的一个或以上评估值;/n目标控制信号确定模块,用于基于所述一个或以上评估值,从所述一个或以上候选控制信号中选择目标控制信号;以及/n传输模块,用于将所述目标控制信号发送至所述车辆的控制组件。/n
【技术特征摘要】
1.一种用于确定自动驾驶中控制信号的系统,包括:
获取模块,用于获取与车辆相关的驾驶信息;
状态确定模块,用于确定所述车辆的状态;
候选控制信号确定模块,用于基于所述驾驶信息和所述车辆的所述状态,通过使用训练的控制模型,确定一个或以上候选控制信号和对应于所述一个或以上候选控制信号的一个或以上评估值;
目标控制信号确定模块,用于基于所述一个或以上评估值,从所述一个或以上候选控制信号中选择目标控制信号;以及
传输模块,用于将所述目标控制信号发送至所述车辆的控制组件。
2.根据权利要求1所述的系统,其特征在于,所述车辆相关的驾驶信息包括所述车辆第一预定范围内的感知信息和地图信息。
3.根据权利要求2所述的系统,其特征在于,所述感知信息包括道路信息和障碍物信息。
4.根据权利要求1所述的系统,其特征在于,所述车辆的所述状态包括所述车辆的速度、所述车辆的加速度和所述车辆的方向盘角度。
5.根据权利要求1-4中任一项的系统,其特征在于,还包括训练模块,所述训练模块用于:
获取初始控制模型;
获取初始样本驾驶信息,所述初始样本驾驶信息包括样本车辆第二预定范围内的初始样本感知信息和所述样本车辆所述第二预定范围内的初始样本地图信息;
获取所述样本车辆的初始样本状态;
基于所述初始样本驾驶信息、所述样本车辆的所述初始样本状态以及所述初始控制模型,确定初始样本控制信号;
基于对应于所述初始样本控制信号的初始奖励值,确定与所述初始控制模型相关的初始样本评估值。其特征在于,所述初始奖励值与与所述初始样本控制信号相关的碰撞条件、与所述初始样本控制信号相关的车道状况或与所述初始样本控制信号有关的停止条件中的至少一个相关;
确定所述初始样本评估值是否满足预设条件;以及
响应于确定所述初始样本评估值满足所述预设条件,指定所述初始控制模型为所述训练的控制模型。
6.根据权利要求5所述的系统,其特征在于,所述训练模块还用于:
响应于确定所述初始样本评估值不满足所述预设条件,执行一个或以上迭代以更新所述初始控制模型,直到更新的样本评估值满足所述预设条件,其特征在于,所述一个或以上迭代中的每一个包括:
基于先前迭代中的奖励值确定更新的控制模型;
获取更新的样本驾驶信息;
基于所述先前迭代中的样本控制信号和所述先前迭代中的所述样
本车辆的样本状态,估计所述样本车辆的更新的样本状态;
基于所述更新的样本驾驶信息、所述样本车辆的所述更新的样本状态以及所述更新的控制模型,确定更新的样本控制信号;
基于对应于所述更新的样本控制信号的更新的奖励值和所述先前
迭代中的样本评估值,确定与所述更新的控制模型相关的更新的样本评估值;以及
确定所述更新的样本评估值是否满足所述预设条件。
7.根据权利要求1所述的系统,其特征在于,所述训练的控制模型包括深度确定性策略梯度DDPG网络模型。
8.根据权利要求1所述的系统,其特征在于,为了基于所述一个或以上评估值从所述一个或以上候选控制信号中选择所述目标控制信号,所述目标控制信号确定模块还用于:
根据预定规则,基于所述一个或以上评估值,从所述一个或以上候选控制信号中选择所述目标控制信号。
9.一种用于确定自动驾驶中控制信号的方法,所述方法包括:
获取与车辆相关的驾驶信息;
确定所述车辆的状态;
基于所述驾驶信息和所述车辆的所述状态,通过使用训练的控制模型,确定一个或以上候选控制信号和对应于所述一个或以上候选控制信号的一个或以上评估值;
基于所述一个或以上评估值,从所述一个或以上候选控制信号中选择目标控制信号;以及
将所述目标控制信号发送至所述车辆的控制组件。
10.根据权利要求9所述的方法,其特征在于,所述车辆相关的驾驶信息包括所述车辆第一预定范围内的感知信息和地图信息。
11.根据权利要求10所述的方法,其特征在于,所述感知信息包括道路信息和障碍物信息。
12.根据权利要求9-所述的方法,其特征在于,所述车辆的所述状态包括所述车辆的速度、所述车辆的加速度和所述车辆的方向盘角度。
13.根据权利要求9-12中任一项所述的方法,其特征在于,所述训练的控制模型由训练过程确定,所述训练过程包括:
获取初始控制模型;
获取初始样本驾驶信息,所述初始样本驾驶信息包括样本车辆第二预定范围内的初始样本感知信息和所述样本车辆所述第二预定范围内的初始样本地图信息;
获取所述样本车辆的初始样本状态;
基于所述初始样本驾驶信息、所述样本车辆的所述初始样本状态以及所述初始控制模型,确定初始样本控制信号;
基于对应于所述初始样本控制信号的初始奖励值,确定与所述初始控制模型相关的初始样本评估值。其特征在于,所述初始奖励值与与所述初始样本控制信号相关的碰撞条件、与所述初始样本控制信号相关的车道状况或与所述初始样本控制信号有关的停止条件中的至少一个相关;
确定所述初始样本评估值是否满足预设条件;以及
响应于确定所述初始样本评估值满足所述预设条件,指定所述初始控制模型为所述训练的控制模型。
14.根据权利要求13所述的方法,其特征在于,所述训练过程进一步包括:
响应于确定所述初始样本评估值不满足所述预设条件,执行一个或以上迭代以更新所述初始控制模型,直到更新的样本评估值满足所述预设条件,其特征在于,所述一个或以上迭代...
【专利技术属性】
技术研发人员:罗威,
申请(专利权)人:北京航迹科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。