基于行为的自适应巡航控制的方法、系统和设备技术方案

技术编号:34206792 阅读:14 留言:0更新日期:2022-07-20 12:05
在各种实施例中,提供了方法、系统和车辆设备。一种用于实施由强化学习(RL)建立的自适应巡航控制(ACC)的方法,包括:由处理器执行自适应巡航控制以接收关于主车辆的操作环境和当前操作的一组车辆输入;由处理器识别在主车辆环境中操作的目标车辆,并量化从感测到的输入导出的关于目标车辆的一组目标车辆参数;由处理器通过生成关于每个车辆的一组速度和扭矩计算值来对主车辆和目标车辆的状态估计进行建模;由处理器基于主车辆和目标车辆的一个或多个建模状态估计,从至少一个奖励函数生成结果集;以及用包含在RL中的驾驶员行为数据处理该结果集,以将一个或多个控制动作与驾驶员行为数据相关联。行为数据相关联。行为数据相关联。

Method, system and equipment of behavior based adaptive cruise control

【技术实现步骤摘要】
基于行为的自适应巡航控制的方法、系统和设备


[0001]本公开总体上涉及车辆,并且更具体地涉及评估驾驶员行为和检测目标车辆行为以训练用于自适应巡航控制功能的智能模型的方法、系统和设备,该智能模型与车辆操作中的驾驶员风格相关联。

技术介绍

[0002]近年来,内陆驾驶车辆的自动驾驶和半自动驾驶特征取得了显著进步,如超级巡航(Super Cruise:免手持的半自动驾驶辅助特征,其使用高清地图和传感器观察道路来帮助车辆加速和减速)、LKA(车道保持辅助,这是一种半自动驾驶特征,其帮助转向以保持车辆在车道上居中)等。车辆仍可能在许多方面得到改进。
[0003]自适应巡航控制(ACC:Adaptive Cruise Control)允许车辆基于驾驶员的偏好自动调整速度,以保持与前方车辆的预设距离。利用目前可用的传统巡航控制系统,驾驶员可以手动调节到前方目标车辆的间隙距离和主车辆的速度。然而,在半自主驾驶中,目标车辆后面的距离可能不适合驾驶员的偏好。在自适应巡航控制(ACC)中执行加速和减速请求时,当前不考虑目标车辆行为。
[0004]期望结合目标车辆来理解主车辆操作的环境,并修改命令请求以提高ACC性能。
[0005]期望定制ACC以基于实时、历史和在线驾驶员

车辆交互定制目标跟随距离,同时仍然保持适当的安全裕度。
[0006]期望基于不同的驾驶场景(例如周围目标)、道路几何形状和目标车辆动力学来分类和学习目标车辆驾驶行为。
[0007]期望至少基于在线和历史信息、驾驶区域、目标类型、道路类别、相对车道位置,基于跟随基于性能偏好的驾驶员行为的目标车辆交互,来为主车辆建立知识库。
[0008]期望基于实时或存储的知识库来针对驾驶员个体或类别调整跟随巡航控制的距离。
[0009]期望能够在资源受限的嵌入式控制器上实现用于驾驶员识别的低成本学习和分类算法,并且在不增加额外硬件的情况下提供以客户为中心的车道跟随定制。
[0010]此外,结合附图以及前述

技术介绍
,从随后的详细描述和所附权利要求中,本公开的其他期望特征和特性将变得显而易见。

技术实现思路

[0011]在至少一个示例性实施例中,提供了一种使用强化学习(RL:Reinforcement Learning)实现自适应巡航控制的方法。该方法包括:由处理器执行自适应巡航控制(ACC)以接收关于主车辆的操作环境和当前操作的一组车辆输入;由处理器识别在主车辆环境中操作的目标车辆,并量化从感测到的输入导出的关于目标车辆的一组目标车辆参数;由处理器通过生成关于每个车辆的一组速度和扭矩计算值来对主车辆和目标车辆的状态估计进行建模;由处理器基于主车辆和目标车辆的一个或多个建模状态估计,从至少一个奖励
函数生成结果集;以及用包含在RL中的驾驶员行为数据处理该结果集,以将一个或多个控制动作与驾驶员行为数据相关联。
[0012]在至少一个实施例中,该方法包括由处理器应用与RL的驾驶员行为数据相关联的至少一个控制动作,以调整主车辆的自适应巡航控制的至少一个操作。
[0013]在至少一个实施例中,该方法包括由处理器基于控制安全检查来调整与RL的驾驶员行为数据相关联的至少一个控制动作。
[0014]在至少一个实施例中,该方法包括由处理器基于从至少一个奖励函数生成的结果集来更新学习矩阵的数据,以创建驾驶员行为的简档。
[0015]在至少一个实施例中,该方法包括由处理器使用一组参数计算奖励函数,该组参数包括主车辆和目标车辆的加速度和速度估计的速度和扭矩计算。
[0016]在至少一个实施例中,该方法包括由处理器基于包含在学习矩阵的数据中的学习的驾驶员行为来调整主车辆和目标车辆之间的一个或多个距离。
[0017]在至少一个实施例中,该方法包括控制安全检查,该控制安全检查包括目标车辆和主车辆的安全速度与速度估计之间的速度差。
[0018]在另一个示例性实施例中,提供了一种系统。该系统包括:由处理器获得的一组输入,该组输入包括具有主车辆操作的一个或多个测量输入的一组车辆输入和关于主车辆的操作环境的感测输入,该主车辆用于执行由包含在主车辆中的强化学习(RL)建立的自适应巡航控制(ACC)系统的控制操作;车辆ACC系统由RL所建立的驾驶员行为预测模型指导,该驾驶员行为预测模型在线学习驾驶员的预期,并且还使用动态神经网络(DNN)来处理该组车辆输入,以基于历史数据调整控制操作;所述处理器被配置为识别在主车辆环境中操作的目标车辆,以量化从处理器中感测到的关于目标车辆的一组目标车辆参数,所述处理器被配置为基于关于每个车辆的一组速度和扭矩计算来对主车辆和目标车辆的状态估计建模;
[0019]在至少一个示例性实施例中,处理器被配置成基于主车辆和目标车辆的一个或多个状态估计从至少一个奖励函数生成结果集;并且所述处理器被配置成利用由所述RL建立的驾驶员行为数据来处理所述结果集,以将一个或多个控制动作与所述驾驶员行为数据相关联。在类似的实施例中,历史数据可以在DNN中用于将一个或多个控制动作与驾驶员行为数据相关联。
[0020]在至少一个示例性实施例中,处理器被配置成应用与由RL建立的驾驶员行为数据相关联的至少一个控制动作来调整主车辆的ACC系统的至少一个控制动作。
[0021]在至少一个示例性实施例中,处理器被配置为基于控制安全检查来调整与由RL建立的驾驶员行为数据相关联的至少一个控制动作。
[0022]在至少一个示例性实施例中,处理器被配置为基于控制安全检查来调整与由RL建立的驾驶员行为数据相关联的至少一个控制动作。
[0023]在至少一个示例性实施例中,处理器被配置成使用一组参数来计算奖励函数,该组参数包括主车辆和目标车辆的加速度和速度估计的速度和扭矩计算。
[0024]在至少一个示例性实施例中,处理器被配置为基于包含在学习矩阵的数据中的学习的驾驶员行为来调整主车辆和目标车辆之间的一个或多个距离。
[0025]在至少一个示例性实施例中,处理器被配置成能够实现控制安全检查,该控制安
全检查包括检查安全速度与目标车辆和主车辆的速度估计之间的速度差。
[0026]在又一示例性实施例中,提供了一种车辆设备。该车辆设备包括车辆控制器,该车辆控制器包括处理器,其中该处理器由强化学习(RL)建立,并被配置为:由处理器执行自适应巡航控制,以接收关于主车辆的操作环境和当前操作的一组车辆输入;由处理器识别在主车辆环境中操作的目标车辆,并量化从感测到的输入导出的关于目标车辆的一组目标车辆参数;由处理器通过生成关于每个车辆的一组速度和扭矩计算来对主车辆和目标车辆的状态估计建模;由处理器基于主车辆和目标车辆的一个或多个建模状态估计,从至少一个奖励函数生成结果集;以及由处理器将该结果集与由RL建立的驾驶员行为数据相关联,以将一个或多个控制动作与驾驶员行为数据相关联。
[0027]在至少一个示例性实施例中,车辆设备包括处理器,该处理器被配置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于实施通过强化学习(RL)建立的自适应巡航控制(ACC)的方法,包括:由处理器执行自适应巡航控制,以接收关于主车辆的操作环境和当前操作的一组车辆输入;由所述处理器识别在主车辆环境中操作的目标车辆,并量化从感测到的输入获得的关于所述目标车辆的一组目标车辆参数;由所述处理器通过生成关于每个车辆的一组速度和扭矩计算来对所述主车辆和所述目标车辆的状态估计进行建模;由所述处理器基于所述主车辆和所述目标车辆的一个或多个建模状态估计,从至少一个奖励函数生成结果集;和用由所包含的RL建立的驾驶员行为数据处理所述结果集,以将一个或多个控制动作与驾驶员行为数据相关联。2.根据权利要求1所述的方法,还包括:由所述处理器施用与通过RL建立的所述驾驶员行为数据相关联的至少一个控制动作,以调整所述主车辆的所述自适应巡航控制的至少一个操作。3.根据权利要求2所述的方法,还包括:由所述处理器基于控制安全检查调整与由RL建立的所述驾驶员行为数据相关联的所述至少一个控制动作。4.根据权利要求3所述的方法,还包括:由所述处理器基于从至少一个奖励函数生成的结果集来更新学习矩阵的数据,以创建驾驶员行为的简档。5.根据权利要求4所述的方法,还包括:由所述处理器使用一组参数计算所述奖励函数,该组参数包括所述主车辆和所述目标车辆的加速度和速度估计的速度和扭矩计算。6.根据权利要求5所述的方法,还包括:由所述处理器基于包含在学习矩阵的数据中的学习的驾驶员行为来调整所述主车辆和所述目标车辆之间的一个或多个距离。7.根据权利要求6所述的方法,其中,所述控制安全检查包括所述目标车辆和所述主车辆的安全速度与速度估计之间的速度差。8.一种系统,包括:由处理器获得的一组输入,包括具有主车辆操作的一个或多个测量输...

【专利技术属性】
技术研发人员:JR萨蒂AS格雷瓦尔M沙里亚里
申请(专利权)人:通用汽车环球科技运作有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1