一种车辆自适应控制方法、系统、存储介质及车辆技术方案

技术编号:38389933 阅读:10 留言:0更新日期:2023-08-05 17:43
本发明专利技术公开了一种车辆自适应控制方法、系统、存储介质及车辆,该方法包括:建立车辆动力学模型,通过车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入;获取车辆的传感器数据,并将其作为深度强化学习算法的状态空间;设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数;设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据状态空间与奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出;对深度神经网络进行在线或离线训练与更新,以实现VCU对车辆的自适应控制。本发明专利技术实现了车辆在不确定性环境中的高效、安全、舒适和稳定的运行。舒适和稳定的运行。舒适和稳定的运行。

【技术实现步骤摘要】
一种车辆自适应控制方法、系统、存储介质及车辆


[0001]本专利技术涉及车辆控制
,具体涉及一种车辆自适应控制方法、系统、存储介质及车辆。

技术介绍

[0002]VCU是Vehicle Control Unit的缩写,是车辆控制单元,是车辆的大脑,负责接收和处理来自各种传感器和执行器的信号,并根据预设的策略和规则,对车辆进行控制和优化。
[0003]而基于人工智能的VCU车辆自适应控制算法是一种利用深度强化学习技术,实现车辆在不确定性环境中的自主驾驶的算法。上述自适应控制算法包括基于确定性模型的VCU车辆控制算法、基于规则引擎的VCU车辆控制算法与基于强化学习的VCU车辆控制算法。
[0004]其中,基于确定性模型的VCU车辆控制算法:这种算法基于物理模型和动力学模型,对车辆进行控制和优化,但通常仅适用于特定、动态程度较低的场景,在复杂场景下缺乏实际应用的意义;基于规则引擎的VCU车辆控制算法:这种算法基于软件工程的先进理念,设计一系列规则和有限状态机来指导车辆行驶策略,但需要考虑多种不同类型的信息,难以覆盖到各种罕见的路况,而且规则的设计和维护需要大量的人工干预;基于强化学习的VCU车辆控制算法:这种算法利用强化学习技术,让车辆通过与环境的交互,自主学习和优化控制策略,但需要大量的训练数据和计算资源,而且难以保证安全性和稳定性。
[0005]因此,现有技术中对于车辆进行控制还存在无法根据实际的行车场景输出适应性的最优策略,对车辆的自适应控制不够精细准确的技术问题。

技术实现思路

[0006]针对现有技术的不足,本专利技术的目的在于提供一种车辆自适应控制方法、系统、存储介质及车辆,旨在通过对车辆动态行为的实时监测和数据分析,实现车辆自适应控制,从而更加精准地实现对车辆的控制和优化。
[0007]本专利技术的第一方面在于提供一种车辆自适应控制方法,所述方法包括:根据车辆结构信息建立车辆动力学模型,通过所述车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入;获取车辆在运动过程中所产生的传感器数据,并将其作为深度强化学习算法的状态空间;设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数;设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据所述状态空间与所述奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出;利用车辆运动过程中产生的数据对所述深度神经网络进行在线或离线训练与更新,提升深度强化学习算法的性能与泛化能力,以实现VCU对车辆的自适应控制。
[0008]根据上述技术方案的一方面,根据车辆结构信息建立车辆动力学模型,通过所述车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入的步骤,包括:根据车辆结构信息,建立非线性二自由度或非线性四自由度的车辆动力学模型;通过所述车辆动力学模型描述不同道路条件下车辆的运动特性,以获取车辆的运动状态与控制输入。
[0009]根据上述技术方案的一方面,获取车辆在运动过程中所产生的传感器数据,并将其作为深度强化学习算法的状态空间的步骤,包括:在车辆处于运动过程中,通过车辆上预设的传感器采集传感器数据;基于与预设传感器之间的通信连接获取所述传感器数据;其中,所述传感器数据包括车速、加速度、转向角、侧偏角、侧偏角速度、轮胎侧向力数据,将所述传感器数据作为深度强化学习算法的状态空间。
[0010]根据上述技术方案的一方面,设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数的步骤,包括:根据其它车辆的历史通行数据,确定车辆在使用过程中的使用场景与实际需求;根据所述使用场景与实际需求,设定目标函数中多个计算参数分别对应的权重系数,以得到所述目标函数;将所述目标函数作为深度强化学习算法的奖励函数;其中,所述目标函数包括最大化行驶效率、最小化能耗与最大化安全性。
[0011]根据上述技术方案的一方面,设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据所述状态空间与所述奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出的步骤,具体包括:根据多层感知机或卷积神经构建深度神经网络;设定所述深度神经网络作为深度强化学习算法的逼近最优值函数或最优策略函数;根据所述状态空间与所述奖励函数,通过梯度下降,输入最优或次优的控制输入,以作为VCU车辆自适应控制算法的控制输出;其中,所述控制输出包括电门指令、制动指令与转向指令。
[0012]根据上述技术方案的一方面,利用车辆运动过程中产生的数据对所述深度神经网络进行在线或离线训练与更新,提升深度强化学习算法的性能与泛化能力,以实现VCU对车辆的自适应控制的步骤,包括:采用随机梯度下降或自适应扭矩估计,根据不同的控制算法选择不同的学习率与折扣因子;根据选定的学习率与折扣因子,对所述深度神经网络进行在线或离线训练与更新;使VCU执行所述深度神经网络以对车辆进行自适应控制。
[0013]本专利技术的第二方面在于提供一种车辆自适应控制系统,所述系统包括:模型建模单元,用于根据车辆结构信息建立车辆动力学模型,通过所述车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入;数据获取单元,用于获取车辆在运动过程中所产生的传感器数据,并将其作为深
度强化学习算法的状态空间;函数设定单元,用于设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数;函数运算单元,用于设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据所述状态空间与所述奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出;车辆控制单元,用于利用车辆运动过程中产生的数据对所述深度神经网络进行在线或离线训练与更新,提升深度强化学习算法的性能与泛化能力,以实现VCU对车辆的自适应控制。
[0014]根据上述技术方案的一方面,所述模型建模单元具体用于:根据车辆结构信息,建立非线性二自由度或非线性四自由度的车辆动力学模型;通过所述车辆动力学模型描述不同道路条件下车辆的运动特性,以获取车辆的运动状态与控制输入。
[0015]本专利技术的第三方面在于提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述技术方案当中所述方法的步骤。
[0016]本专利技术的第四方面在于提供一种车辆,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述技术方案当中所述方法的步骤。
[0017]与现有技术相比,采用本专利技术所示的车辆自适应控制方法、系统、存储介质及车辆,有益效果在于:通过建立车辆动力学模型,该车辆动力学模型用于准确地描述车辆在不同道路条件下的运动特性,为控制算法提供可靠的基础;以及通过采集车辆运行过程中的各种传感器数据,用于反映车辆的实时状态和环境信息,为控制算法提供丰富的输入;而设定车辆运行过程中的目标函数,可以根据不同的场景和需求平衡各个目标之间的关系,为控制算法提供明确的指导;另外通过设计深度神经网络作为控制算法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车辆自适应控制方法,其特征在于,所述方法包括:根据车辆结构信息建立车辆动力学模型,通过所述车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入;获取车辆在运动过程中所产生的传感器数据,并将其作为深度强化学习算法的状态空间;设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数;设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据所述状态空间与所述奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出;利用车辆运动过程中产生的数据对所述深度神经网络进行在线或离线训练与更新,提升深度强化学习算法的性能与泛化能力,以实现VCU对车辆的自适应控制。2.根据权利要求1所述的车辆自适应控制方法,其特征在于,根据车辆结构信息建立车辆动力学模型,通过所述车辆动力学模型描述车辆在不确定环境中的运动状态与控制输入的步骤,包括:根据车辆结构信息,建立非线性二自由度或非线性四自由度的车辆动力学模型;通过所述车辆动力学模型描述不同道路条件下车辆的运动特性,以获取车辆的运动状态与控制输入。3.根据权利要求1所述的车辆自适应控制方法,其特征在于,获取车辆在运动过程中所产生的传感器数据,并将其作为深度强化学习算法的状态空间的步骤,包括:在车辆处于运动过程中,通过车辆上预设的传感器采集传感器数据;基于与预设传感器之间的通信连接获取所述传感器数据;其中,所述传感器数据包括车速、加速度、转向角、侧偏角、侧偏角速度、轮胎侧向力数据,将所述传感器数据作为深度强化学习算法的状态空间。4.根据权利要求1所述的车辆自适应控制方法,其特征在于,设定车辆在运动过程中的目标函数,并将其作为深度强化学习算法的奖励函数的步骤,包括:根据其它车辆的历史通行数据,确定车辆在使用过程中的使用场景与实际需求;根据所述使用场景与实际需求,设定目标函数中多个计算参数分别对应的权重系数,以得到所述目标函数;将所述目标函数作为深度强化学习算法的奖励函数;其中,所述目标函数包括最大化行驶效率、最小化能耗与最大化安全性。5.根据权利要求1所述的车辆自适应控制方法,其特征在于,设定深度神经网络作为深度强化学习算法的值函数或策略函数,根据所述状态空间与所述奖励函数,输入最优或次优的控制输入,并将其作为VCU车辆自适应控制算法的控制输出的步骤,具体包括:根据多层感知机或卷积...

【专利技术属性】
技术研发人员:龚循飞邓建明罗锋于勤张俊熊慧慧张萍樊华春廖程亮官志明
申请(专利权)人:江西五十铃汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1